En los últimos años, los modelos de inteligencia artificial del lenguaje se han vuelto muy buenos en ciertas tareas.En particular, sobresalen para predecir la siguiente palabra en una cadena de texto;Esta tecnología ayuda a los motores de búsqueda y las aplicaciones de mensajes de texto a predecir la siguiente palabra que va a escribir.
La generación más reciente de modelos de lenguaje predictivo también parece aprender algo sobre el significado subyacente del lenguaje.Estos modelos no solo pueden predecir la palabra que viene a continuación, sino que también realiza tareas que parecen requerir cierto grado de comprensión genuina, como respuesta de preguntas, resumen de documentos y finalización de la historia..
Dichos modelos fueron diseñados para optimizar el rendimiento para la función específica de predecir el texto, sin intentar imitar nada sobre cómo el cerebro humano realiza esta tarea o comprende el lenguaje.Pero un nuevo estudio de los neurocientíficos del MIT sugiere que la función subyacente de estos modelos se asemeja a la función de los centros de procesamiento del lenguaje en el cerebro humano..
Los modelos de computadora que funcionan bien en otros tipos de tareas de lenguaje no muestran esta similitud con el cerebro humano, ofreciendo evidencia de que el cerebro humano puede usar la predicción de la próxima palabra para impulsar el procesamiento del lenguaje.
"Cuanto mejor sea el modelo para predecir la siguiente palabra, más de cerca se ajusta al cerebro humano", dice Nancy Kanwisher, el Walter A.Profesor de Neurociencia Cognitiva de Rosenblith, miembro del Instituto McGovern para la Investigación del Cerebro y Centro de cerebros, mentes y máquinas (CBMM) del MIT, y autor del nuevo estudio."Es sorprendente que los modelos encajen tan bien, y sugiere muy indirectamente que tal vez lo que el sistema de lenguaje humano está haciendo es predecir lo que sucederá a continuación.."
Joshua Tenenbaum, profesor de ciencia cognitiva computacional en el MIT y miembro del Laboratorio de Inteligencia Artificial de CBMM y MIT (CSAIL);y Evelina Fedorenko, el Frederick A.y Carole J.Middleton Profesor Asociado de Neurociencia Asociado y miembro del Instituto McGovern, son los autores principales del estudio, que aparece esta semana en las Actas de la Academia Nacional de Ciencias..Martin Schrimpf, un estudiante graduado del MIT que trabaja en CBMM, es el primer autor del periódico.