Ir al contenido principal

Inteligencia Artificial y Educación ¿dónde estamos? (IIIa): Tipos y enunciados de capacidades de ChatGPT. Calificación de su utilidad.

 

Crédito de la foto: Focal Foto en Flickr.
                                                        

                                                        Cuarta de una serie de entradas que comenzó con ésta.

Lo tercero que veremos, será lo que constituye una de las cuestiones clave de este artículo: Veremos que, si bien no son tantos, sí hay motivos para pensar que la presencia de la Inteligencia Artificial Generativa (GenAI) va a propiciar importantes cambios en las prácticas, algunos o muchos de los cuales posiblemente ya se estés produciendo, aunque el estudio sobre experiencia en UK ya citado aún no ha dado tiempo para procesarlos y para sistematizarlos, y mucho menos en otras latitudes.

Eso es, por el momento, lo único que parece que, de forma esporádica y mediante casos y prácticas personales aisladas, se ha justificado mínimamente. Al menos en el caso que hemos encontrado reflejado por Korinek (2023) en su artículo Language models and cognitive automation for economic research [MZ1] .

Tampoco es descartable que se estén produciendo lo que serán anticipos de cambios de calado, en aspectos básicos, ante los cuales es preciso dar respuestas. Pero eso lo trataremos después.

No sería un trabajo muy importante si no fuera porque no hay muchos otros. Es el único empírico que he podido localizar.

Básicamente, según el propio autor dice, en él "informa de su calificación subjetiva sobre qué tan útiles encontró las capacidades LLM descritas al 1 de febrero de 2023". Se refiere a las prácticas que él mismo hizo y con las que elaboró un estudio personal de 25 casos de uso de ChatGPT en 25 prácticas que él hizo y su opinión sistematiza en categorías sobre ellas.

Ello, no obstante, en la línea triunfalista y optimista que señalamos, permitió decir en un medio, un blog de una prestigiosa revista y en su perfil en Twitter que, a partir de lo recogido en el trabajo “la investigación y la producción científica nunca volverán a ser lo mismo”, se entiende que con el concurso del ChatGPT y los LLM.

El resumen lo refleja en una tabla de tres columnas. Una con las categorías que establece en su taxonomía para las tareas en las que utiliza ChatGPT--- hay que tener en cuenta que es un profesor e investigador de economía que utiliza las matemáticas en sus clases e investigaciones, en particular el análisis diferencial y las derivadas, así como la analítica de datos---, otra columna para las propias tareas y la tercera para una asignación de utilidad, utilizando una valoración numérica entera entre 1 y 3. De menos a maor utilidad, fiabilidad o consistencia en el uso para la tarea.

Puesto que aunque yo no he escrito un articulo de este tipo ni he tomado notas de mis propias experiencias, sí las he hecho en una cantidad incluso mayor (de ello ha quedado algo reflejado) si bien no tan operativa como son las de codificación, y en lo que sigue:

A) he realizado una adaptación de su tabla, ajustando y traduciendo los conceptos y términos de la taxonomía y de las tareas y

B) he añadido una cuarta columna con mis valoraciones. Asignando mis propios valores de utilidad.

Encuentro pues muy útil las calificaciones sobre todo por su descripción que es la que sigue:

La calificación varía del 1 al 3, donde 1 describe capacidades que actualmente se consideran estrictamente experimentales, que hacen precisa de forma imprescindible la observación y el discernimiento humano, en los cuales si lo hace o lo obtenemos de ChatGPT pueden arrojar resultados inconsistentes, que requieren una supervisión humana significativa e imprescindible; 2 se atribuye a capacidades que, hechas por ChatGPT. probablemente sean útiles y que ahorren tiempo, pero que son en alguna medida inconsistentes o no seguras, por lo que aún requieren una supervisión humana cuidadosa; y 3 refleja capacidades que ya son, con ChatGPT muy útiles y funcionan de la manera esperada la mayor parte del tiempo. Incorporar estas últimas capacidades a su flujo de tareas definitivamente tiene claro que le ahorrará tiempo y hará más productivo el uso de la herramienta.

 

Categoría

 

Tarea

Utilidad Korinek

Utilidad mía

Ideación

 

Lluvia de ideas

3

 

2

Evaluación de ideas

2

1

Proporcionar contraargumentos

3

1

Escribir

 

Sintetizar texto

3

3

Editar texto

3

3

Evaluar texto

3

2

Generar títulos y titulares atractivos

3

2

Generar tweets para promocionar un artículo

3

3

Escribir la parte de investigación del artículo como cuestión principal

 

Resumen

3

3

Revisión de la literatura

1

1

Formatear citas y referencias

3

3

Traducción del artículo

3

3

Explicar conceptos previos

2

1

Crear y escribir programas informáticos (programación)

 

Escribir el programa

2

-

Explicar el programa

2

-

Traducir el programa a otro lenguaje

3

-

Depuración del programa

2

-

Análisis de los datos

 

Extraer datos del texto

3

3

Reformatear datos

3

3

Clasificar y asignar valores a expresiones textuales

2

1

Extraer opiniones y conclusiones propias del texto. O categorizar, en un sistema de valores dado expresiones, de un texto.

 

2

1

Simular análisis humano subjetivo.

Esto se basa en que la observación de los datos de entrenamiento de los LLM crea una gran cantidad de información sobre aspectos del proceder humano en la evaluación de datos (Opinión de Korinek (February 10, 2023), Argyle et al. (2022) y de Horton (2022)

2

1

Matemáticas

 

Configuración de modelos

2

2

Derivación de ecuaciones (por los ejemplos que pone se refiere tanto a derivación de funciones, como derivación de igualdades (ecuaciones), como generación de ecuaciones diferenciales).

1

1

Explicar modelos

1

1

Tabla 1: Tipos y enunciados de capacidades de ChatGPT. Calificación de su utilidad


Las columnas tercera y cuarta corresponden a la calificación subjetiva de las capacidades de LLM hecha por Korinek el 1 de febrero de 2023, y por la quien suscribe a fecha 5 de diciembre de 2023:

1 = los resultados son empíricos y humanos por naturaleza; Los resultados de ChatGPT son inconsistentes y requieren una supervisión humana significativa.

2 = Chat GPT presenta cierta utilidad, pero requiere supervisión. Probablemente su uso le ahorrará tiempo

3 = claramente útil; incorporarlos en el flujo de su trabajo le ahorrará tiempo.

-  = carezco de juicio y/o de práctica (mía)

 

Referencias

Argyle, L. P., Busby, E. C., Fulda, N., Gubler, J., Rytting, C., and Wingate, D.(2022). Out of one, many: Using language models to simulate human samples.arXiv:2209.06899

Horton, J. J. (2022). Large language models as simulated economic agents: What canwe learn from homo silicus? working paper

Korinek, A. (2023). Language models and cognitive automation for economic research (No. w30957). National Bureau of Economic Research.


Comentarios

Entradas populares de este blog

La verdad nunca es viral

A finales del año pasado una fotografía se convirtió en viral en las redes. En ella se observaban a unos adolescentes de espaldas al cuadro de Rembrard “La Ronda” que, absortos en sus móviles, ignoraban aparentemente la obra. La sola composición de la imagen puesta en la red hizo el resto. ¿Cómo eludir, como ignorar un mensaje evidente por sí mismo? Mis profesores de Matemáticas del instituto siempre decían “lo que es evidente no necesita demostración”. La cuestión es ¿qué es evidente para cada uno? Y lo evidente era que los muchachos estaban absortos vaya usted a saber en qué perniciosas o al menos distractivas cosas: En el Whatsapp, en un videojuego, en Facebook,… dando la espalda a una obra maestra, a todo un símbolo de nuestra civilización. A continuación la ronda, esta vez viral y en las redes sociales, de comentarios de gurús y expertos, y de no pocos maestros, sociólogos y pedagogos, con las repetidas metáforas concluyentes, cual Casandras indignadas y/o desanimad...

Aprendizaje inteligente

Éste post, como el anterior y   los siguientes, recoge un aspecto particular de lo tratado en el artículo La universidad inteligente (Zapata-Ros, 2018) de RED: Revista de Educación a Distancia . Nos vamos a remitir para introducir el concepto de aprendizaje inteligente a una especie de tautología o de cláusula recursiva. De esta forma vamos inicialmente a definir aprendizaje inteligente como aquél que se desarrolla en los entornos inteligentes de aprendizaje. Pero esta tautología es solo aparente. Supone un avance conceptual. Porque este último constructo proviene de dos anteriores: el de entornos de aprendizaje, algo que es suficientemente conocido ( Watson & Watson, 2007; Zapata-Ros, 2003 ) tanto en la vertiente de LMS, como en la de entornos inclusivos, y el de tecnología inteligente, la que utiliza recursos y affordances tecnológicas de detección y de recomendación. Aprendizaje inteligente es aquél aprendizaje que pueden desencadenar y producir los sis...

Los jesuitas y la educación (I)

1 La disrupción de los colegios jesuitas Estos días han aparecido  noticias como ésta en la prensa :   Los jesuitas eliminan las asignaturas, exámenes y horarios de sus colegios en Cataluña , donde se afirma Los colegios de jesuitas de Cataluña, en los que estudian más de 13.000 alumnos, han comenzado a implantar un nuevo modelo de enseñanza que ha eliminado asignaturas, exámenes y horarios y ha transformado las aulas en espacios de trabajo donde los niños adquieren los conocimientos haciendo proyectos conjuntos (…)  Los jesuitas (…) han diseñado un nuevo modelo pedagógico en el que han desaparecido las clases magistrales, los pupitres, los deberes y las aulas tradicionales, en un proyecto que ha comenzado en quinto de primaria y primero de ESO en tres de sus escuelas y que se irá ampliando al resto.  “Educar no es solo transmitir conocimientos El proyecto impulsa "las inteligencias múltiples y sacar todo el potencial" de los alumnos y que ...