Nos últimos anos, os modelos de inteligência artificial da linguagem se tornaram muito bons em determinadas tarefas.Mais notavelmente, eles se destacam em prever a próxima palavra em uma série de texto;Essa tecnologia ajuda os mecanismos de pesquisa e aplicativos de mensagens de texto a prever a próxima palavra que você vai digitar.
A geração mais recente de modelos de linguagem preditiva também parece aprender algo sobre o significado subjacente da linguagem.Esses modelos podem não apenas prever a palavra que vem a seguir, mas também executar tarefas que parecem exigir algum grau de entendimento genuíno, como resposta a perguntas, resumo de documentos e conclusão da história.
Esses modelos foram projetados para otimizar o desempenho para a função específica da previsão do texto, sem tentar imitar nada sobre como o cérebro humano executa essa tarefa ou entende a linguagem.Mas um novo estudo dos neurocientistas do MIT sugere que a função subjacente desses modelos se assemelha à função dos centros de processamento de linguagem no cérebro humano.
Modelos de computador que têm um bom desempenho em outros tipos de tarefas de linguagem não mostram essa semelhança com o cérebro humano, oferecendo evidências de que o cérebro humano pode usar a previsão da próxima palavra para impulsionar o processamento da linguagem.
"Quanto melhor o modelo está prevendo a próxima palavra, mais de perto se encaixa no cérebro humano", diz Nancy Kanwisher, o Walter A.Rosenblith Professor de Neurociência Cognitiva, membro do Instituto McGovern Institute de Pesquisa Cerebral do MIT e Centro de Brains, Mentes e Máquinas (CBMM), e um autor do novo estudo."É incrível que os modelos se encaixem tão bem, e indiretamente sugere que talvez o que o sistema de linguagem humana esteja fazendo seja prever o que vai acontecer a seguir.”
Joshua Tenenbaum, professor de ciência cognitiva computacional do MIT e membro do Laboratório de Inteligência Artificial do CBMM e do MIT (CSAIL);e Evelina Fedorenko, o Frederick A.e Carole J..Middleton Career Development Professor de Neurociência e membro do Instituto McGovern, são os autores seniores do estudo, que aparecem nesta semana nos procedimentos da Academia Nacional de Ciências.Martin Schrimpf, um estudante de pós -graduação do MIT que trabalha no CBMM, é o primeiro autor do artigo.