Au cours des dernières années, les modèles d'intelligence artificielle de la langue sont devenus très bons dans certaines tâches.Plus particulièrement, ils excellent à prédire le mot suivant dans une chaîne de texte;Cette technologie aide les moteurs de recherche et les applications de textos prédire le mot suivant que vous allez taper.
La génération la plus récente de modèles de langue prédictive semble également apprendre quelque chose sur le sens sous-jacent de la langue.Ces modèles peuvent non seulement prédire le mot qui vient ensuite, mais également effectuer des tâches qui semblent nécessiter un certain degré de compréhension authentique, telles que la réponse aux questions, le résumé des documents et la fin de l'histoire.
Ces modèles ont été conçus pour optimiser les performances pour la fonction spécifique de la prévision du texte, sans tenter d'imiter quoi que ce soit sur la façon dont le cerveau humain exécute cette tâche ou comprend la langue.Mais une nouvelle étude des neuroscientifiques du MIT suggère que la fonction sous-jacente de ces modèles ressemble à la fonction des centres de transformation de la langue dans le cerveau humain.
Les modèles informatiques qui fonctionnent bien sur d'autres types de tâches linguistiques ne montrent pas cette similitude avec le cerveau humain, offrant des preuves que le cerveau humain peut utiliser la prédiction des mots suivants pour stimuler le traitement du langage.
«Plus le modèle est de prédire le mot suivant, plus il convient au cerveau humain», explique Nancy Kanwisher, le Walter A.Rosenblith Professeur de neurosciences cognitives, membre de l'Institut McGovern pour la recherche sur le cerveau et du centre de cerveaux, d'esprit et de machines (CBMM), et auteur de la nouvelle étude.«Il est étonnant que les modèles soient si bien, et cela suggère très indirectement que peut-être ce que le système de langage humain fait est de prédire ce qui va se passer ensuite."
Joshua Tenenbaum, professeur de sciences cognitives informatiques au MIT et membre du Laboratoire d'intelligence artificielle du CBMM et du MIT (CSAIL);et Evelina Fedorenko, le Frederick A.et Carole J.Le professeur agrégé de neuroscience et membre de l'Institut McGovern de McGovern, professeur agrégé de neurosciences et membre de l'Institut McGovern, qui apparaît cette semaine dans les actes de la National Academy of Sciences.Martin Schrimpf, un étudiant diplômé du MIT qui travaille à CBMM, est le premier auteur du journal.