Ir al contenido principal

Inteligencia Artificial y Educación ¿dónde estamos? (IIIa): Tipos y enunciados de capacidades de ChatGPT. Calificación de su utilidad.

 

Crédito de la foto: Focal Foto en Flickr.
                                                        

                                                        Cuarta de una serie de entradas que comenzó con ésta.

Lo tercero que veremos, será lo que constituye una de las cuestiones clave de este artículo: Veremos que, si bien no son tantos, sí hay motivos para pensar que la presencia de la Inteligencia Artificial Generativa (GenAI) va a propiciar importantes cambios en las prácticas, algunos o muchos de los cuales posiblemente ya se estés produciendo, aunque el estudio sobre experiencia en UK ya citado aún no ha dado tiempo para procesarlos y para sistematizarlos, y mucho menos en otras latitudes.

Eso es, por el momento, lo único que parece que, de forma esporádica y mediante casos y prácticas personales aisladas, se ha justificado mínimamente. Al menos en el caso que hemos encontrado reflejado por Korinek (2023) en su artículo Language models and cognitive automation for economic research [MZ1] .

Tampoco es descartable que se estén produciendo lo que serán anticipos de cambios de calado, en aspectos básicos, ante los cuales es preciso dar respuestas. Pero eso lo trataremos después.

No sería un trabajo muy importante si no fuera porque no hay muchos otros. Es el único empírico que he podido localizar.

Básicamente, según el propio autor dice, en él "informa de su calificación subjetiva sobre qué tan útiles encontró las capacidades LLM descritas al 1 de febrero de 2023". Se refiere a las prácticas que él mismo hizo y con las que elaboró un estudio personal de 25 casos de uso de ChatGPT en 25 prácticas que él hizo y su opinión sistematiza en categorías sobre ellas.

Ello, no obstante, en la línea triunfalista y optimista que señalamos, permitió decir en un medio, un blog de una prestigiosa revista y en su perfil en Twitter que, a partir de lo recogido en el trabajo “la investigación y la producción científica nunca volverán a ser lo mismo”, se entiende que con el concurso del ChatGPT y los LLM.

El resumen lo refleja en una tabla de tres columnas. Una con las categorías que establece en su taxonomía para las tareas en las que utiliza ChatGPT--- hay que tener en cuenta que es un profesor e investigador de economía que utiliza las matemáticas en sus clases e investigaciones, en particular el análisis diferencial y las derivadas, así como la analítica de datos---, otra columna para las propias tareas y la tercera para una asignación de utilidad, utilizando una valoración numérica entera entre 1 y 3. De menos a maor utilidad, fiabilidad o consistencia en el uso para la tarea.

Puesto que aunque yo no he escrito un articulo de este tipo ni he tomado notas de mis propias experiencias, sí las he hecho en una cantidad incluso mayor (de ello ha quedado algo reflejado) si bien no tan operativa como son las de codificación, y en lo que sigue:

A) he realizado una adaptación de su tabla, ajustando y traduciendo los conceptos y términos de la taxonomía y de las tareas y

B) he añadido una cuarta columna con mis valoraciones. Asignando mis propios valores de utilidad.

Encuentro pues muy útil las calificaciones sobre todo por su descripción que es la que sigue:

La calificación varía del 1 al 3, donde 1 describe capacidades que actualmente se consideran estrictamente experimentales, que hacen precisa de forma imprescindible la observación y el discernimiento humano, en los cuales si lo hace o lo obtenemos de ChatGPT pueden arrojar resultados inconsistentes, que requieren una supervisión humana significativa e imprescindible; 2 se atribuye a capacidades que, hechas por ChatGPT. probablemente sean útiles y que ahorren tiempo, pero que son en alguna medida inconsistentes o no seguras, por lo que aún requieren una supervisión humana cuidadosa; y 3 refleja capacidades que ya son, con ChatGPT muy útiles y funcionan de la manera esperada la mayor parte del tiempo. Incorporar estas últimas capacidades a su flujo de tareas definitivamente tiene claro que le ahorrará tiempo y hará más productivo el uso de la herramienta.

 

Categoría

 

Tarea

Utilidad Korinek

Utilidad mía

Ideación

 

Lluvia de ideas

3

 

2

Evaluación de ideas

2

1

Proporcionar contraargumentos

3

1

Escribir

 

Sintetizar texto

3

3

Editar texto

3

3

Evaluar texto

3

2

Generar títulos y titulares atractivos

3

2

Generar tweets para promocionar un artículo

3

3

Escribir la parte de investigación del artículo como cuestión principal

 

Resumen

3

3

Revisión de la literatura

1

1

Formatear citas y referencias

3

3

Traducción del artículo

3

3

Explicar conceptos previos

2

1

Crear y escribir programas informáticos (programación)

 

Escribir el programa

2

-

Explicar el programa

2

-

Traducir el programa a otro lenguaje

3

-

Depuración del programa

2

-

Análisis de los datos

 

Extraer datos del texto

3

3

Reformatear datos

3

3

Clasificar y asignar valores a expresiones textuales

2

1

Extraer opiniones y conclusiones propias del texto. O categorizar, en un sistema de valores dado expresiones, de un texto.

 

2

1

Simular análisis humano subjetivo.

Esto se basa en que la observación de los datos de entrenamiento de los LLM crea una gran cantidad de información sobre aspectos del proceder humano en la evaluación de datos (Opinión de Korinek (February 10, 2023), Argyle et al. (2022) y de Horton (2022)

2

1

Matemáticas

 

Configuración de modelos

2

2

Derivación de ecuaciones (por los ejemplos que pone se refiere tanto a derivación de funciones, como derivación de igualdades (ecuaciones), como generación de ecuaciones diferenciales).

1

1

Explicar modelos

1

1

Tabla 1: Tipos y enunciados de capacidades de ChatGPT. Calificación de su utilidad


Las columnas tercera y cuarta corresponden a la calificación subjetiva de las capacidades de LLM hecha por Korinek el 1 de febrero de 2023, y por la quien suscribe a fecha 5 de diciembre de 2023:

1 = los resultados son empíricos y humanos por naturaleza; Los resultados de ChatGPT son inconsistentes y requieren una supervisión humana significativa.

2 = Chat GPT presenta cierta utilidad, pero requiere supervisión. Probablemente su uso le ahorrará tiempo

3 = claramente útil; incorporarlos en el flujo de su trabajo le ahorrará tiempo.

-  = carezco de juicio y/o de práctica (mía)

 

Referencias

Argyle, L. P., Busby, E. C., Fulda, N., Gubler, J., Rytting, C., and Wingate, D.(2022). Out of one, many: Using language models to simulate human samples.arXiv:2209.06899

Horton, J. J. (2022). Large language models as simulated economic agents: What canwe learn from homo silicus? working paper

Korinek, A. (2023). Language models and cognitive automation for economic research (No. w30957). National Bureau of Economic Research.


Comentarios

Entradas populares de este blog

MOOCs: Negar la evaluación, negar la metodología,...negar al estudiante

A George Siemens se le considera, junto con Stephen Downes, como padre del "conectivismo". Con un poco menos de unanimidad a ambos se les considera como a los padres de los MOOCs (Curiosamente la versión española de Wikipedia considera que el creador o protocreador fue David Wiley, y no los cita. Mientras que la versión inglesa e internacional no nombra a Wiley y dice que los creadores del concepto y del término fueron Siemens y Downes).   Pues bien ahora, en su blog Elearnspace , Siemens se queja de lo que ha pasado con Coursera (y antes con su CCK08). Se queja de que han hecho desaparecer los diálogos, que son la producción de los alumnos y los alumnos son los MOOCs, de manera que negar los diálogos es negar a los estudiantes y al MOOC. Dice:  Este incidente es significativo.  MOOCs no son nada sin los alumnos. En este caso, parece que el instructor decidió cerrar el curso. La Facultad es propietaria del contenido, Coursera es propietaria de la ...

La verdad nunca es viral

A finales del año pasado una fotografía se convirtió en viral en las redes. En ella se observaban a unos adolescentes de espaldas al cuadro de Rembrard “La Ronda” que, absortos en sus móviles, ignoraban aparentemente la obra. La sola composición de la imagen puesta en la red hizo el resto. ¿Cómo eludir, como ignorar un mensaje evidente por sí mismo? Mis profesores de Matemáticas del instituto siempre decían “lo que es evidente no necesita demostración”. La cuestión es ¿qué es evidente para cada uno? Y lo evidente era que los muchachos estaban absortos vaya usted a saber en qué perniciosas o al menos distractivas cosas: En el Whatsapp, en un videojuego, en Facebook,… dando la espalda a una obra maestra, a todo un símbolo de nuestra civilización. A continuación la ronda, esta vez viral y en las redes sociales, de comentarios de gurús y expertos, y de no pocos maestros, sociólogos y pedagogos, con las repetidas metáforas concluyentes, cual Casandras indignadas y/o desanimad...

¿Tiene un sentido la evolución de los MOOCs?

Dedicado a Grainne Conole y a José Mota, unos buenos amigos  con quienes a veces debato sobre estos temas. Hemos observado una línea de evolución de los MOOCs desde su inicio. Y creo haber descubierto cual es el sentido de esa línea. Los MOOCs se anunciaron como informales, disruptivos, abiertos y gratuitos. En las últimas semanas hemos visto como dejaban de ser abiertos y gratuitos, por ejemplo   eCornell   ya ofrece un MOOC al que únicamente pueden acceder estudiantes que lo cursen pagando (Mangan,   K.   2013) . Algunos constituyen una auténtica alternativa a los estudios reglados, por tanto no son informales. Así sucede con   la iniciativa de  2U (Kolowich,2013)  que imparte estudios acreditados por diez prestigiosas universidades del consorcio . El 9 de enero de 2013,   Coursera anuncia que venderá certificados de estudios seguidos en MOOCs  y acreditación de identidades (Young, 2013).   Una cosa, dar car...