Cada vez que Eddie Smolyansky tuvo unos momentos para sí mismo, trató de mantenerse al tanto de las nuevas publicaciones en su campo..Pero para 2016, el investigador de visión por computadora, con sede en Tel Aviv, Israel, estaba recibiendo cientos de recomendaciones de literatura automatizadas por día."En algún momento los brotes del baño no fueron suficientes", dice.Las recomendaciones fueron "demasiado e imposibles de seguir".
La "fatiga de alimentación" de Smolyansky será familiar para muchos académicos.Las herramientas de alerta académica, originalmente diseñadas para centrar la atención en los documentos relevantes, se han convertido en un obstáculo, inundando las bandejas de entrada de los científicos de todo el mundo..
"Ni siquiera he estado leyendo mis búsquedas automatizadas de PubMed últimamente porque realmente es abrumador", dice Craig Kaplan, biólogo de la Universidad de Pittsburgh en Pensilvania.“Sinceramente, no puedo mantener al tanto de la literatura."
Pero el cambio está en marcha.En 2019, Smolyansky cofundó los documentos conectados, uno de una nueva generación de herramientas de mapeo y recomendación de literatura visual.También están disponibles otros servicios que prometen domar la sobrecarga de información, integrando los feeds de Twitter y las noticias diarias, así como la investigación..
Historia de origen
En lugar de servir una lista diaria de nuevos artículos por correo electrónico, Connected Papers utiliza un solo "documento de origen" elegido por el usuario para construir un mapa de investigación relacionada, basada en parte en citas superpuestas.El servicio recientemente superó a un millón de usuarios, dice Smolyansky.
Los mapas están codificados por colores por fecha de publicación, y los usuarios pueden alternar entre "prior", seminal, documentos y más tarde, "derivado", trabajos que se basan en ellos.La idea es que los científicos pueden buscar un documento de origen que los interese, y ver en el mapa resultante que los documentos recientes han hecho un chapuzón en su campo, cómo se relacionan con otras investigaciones y cuántas citas han acumulado que han acumulado.
tl; dr: Esta IA resume trabajos de investigación en una oración
“You do not have to sit on the hose of papers and look at every paper that comes out for fear of missing it," says Smolyansky.La herramienta también es útil cuando los científicos quieren sumergirse en un campo completamente nuevo, agrega, proporcionando una visión general de la literatura esencial..
Otra herramienta de mapeo visual es Open Knowledge Maps, un servicio ofrecido por una organización sin fines de lucro con sede en Viena del mismo nombre.Fue fundada en 2015 por Peter Kraker, ex investigador de comunicación académica en la Universidad Tecnológica de Graz en Austria.
Los mapas de conocimiento abierto crean sus mapas basados en palabras clave en lugar de un artículo central, y se basa en la similitud de texto y los metadatos para resolver cómo se relacionan los documentos.La herramienta organiza 100 documentos en subcampos similares en burbujas cuyas posiciones relativas sugieren similitud;Una búsqueda de artículos sobre "cambio climático", por ejemplo, podría producir una burbuja relacionada sobre la "cognición de riesgos".
Los mapas de estas burbujas se pueden construir en unos 20 segundos, y los usuarios pueden cambiarlos para incluir los 100 documentos publicados de relevancia más recientemente u otros recursos.Los mapas de conocimiento abiertos incluyen no solo artículos de revistas, sino también contenido como conjuntos de datos y software de investigación.Sus usuarios han creado más de 400,000 mapas hasta ahora, dice Kraker.
Amie Fairs, que estudia el lenguaje en la Universidad de Aix-Marseille en Francia, es una autoproclamada entusiasta de los mapas de conocimiento abierto. “One particularly nice thing about Open Knowledge Maps is that you can search very broad topics, like ‘language production’, and it can group papers into themes you may not have considered," Fairs says.Por ejemplo, cuando buscó "regiones fonológicas del cerebro", las áreas del cerebro que procesan el sonido y el significado, los mapas de conocimiento abierto sugirieron un subcampo de investigación sobre las diferencias relacionadas con la edad en el procesamiento. “I hadn’t considered looking in the ageing literature for information about this before, but now I will," she says.
Yet despite her enthusiasm for the service, Fairs still tends to find new papers through alerts from Google Scholar, the dominant tool in the field; it’s easier to go “down the rabbit hole", she explains, following a chain of papers that cite each other.
Haga clic para recomendar
Google Scholar recomienda documentos dependiendo de los artículos que los usuarios hayan escrito y enumeren sus perfiles. The algorithm isn’t public, but the company says that the recommendations are based on “the topics of your articles, the places where you publish, the authors you work with and cite, the authors that work in the same area as you and the citation graph".Los usuarios pueden configurar manualmente alertas de correo electrónico adicionales basadas en búsquedas de palabras clave o autores particulares.
Cómo la tecnología AI puede domar la literatura científica
Aaron Tay, un bibliotecario de la Universidad de Gestión de Singapur que estudia herramientas de búsqueda académica, recibe recomendaciones de literatura de Twitter y Google Scholar, y descubre que este último a menudo destaca los mismos artículos que sus colegas humanos, aunque unos días después. Google Scholar “is almost always on target", he says.
Besides published articles, Google Scholar might also pick up preprints as well as “low-quality theses and dissertations", Tay says. Even so, “you get some gems you might not have seen", he says.(Scopus, una base de datos de literatura competitiva mantenida por el editor con sede en Amsterdam Elsevier, comenzó a incorporar preimpresiones a principios de este año, dice un portavoz..Pero no indexa tesis y disertaciones. “There will be titles that do not meet the Scopus standards but are covered by Google Scholar," he says.)
Google Scholar no revela el tamaño de su base de datos, pero se reconoce ampliamente que es el corpus más grande que existe, con cerca de 400 millones de artículos por una estimación (M. Gusenbauer Scientometrics 118, 177–214; 2019).Mientras tanto, los mapas de conocimiento abiertos se basan en el motor de búsqueda académico de Bielefeld de código abierto, que cuenta con más de 270 millones de documentos, incluidas las preimpresiones, y está curado para eliminar el spam.
Connected Papers utiliza el corpus disponible públicamente compilado por Semantic Scholar, una herramienta creada en 2015 por el Allen Institute for Artificial Intelligence en Seattle, Washington, asciende a alrededor de 200 millones de artículos, incluidas las preimpresiones.. Smolyansky acknowledges this size discrepancy means that “very rarely" Google Scholar will find “some niche 1970s paper" that Semantic Scholar does not.
El sistema de alerta de Semantic Scholar, llamado Feed de investigación adaptativa, crea una lista de documentos recomendados que los usuarios pueden capacitar al gustar o no los artículos que ven..Para decidir qué documentos son similares a los que utiliza un modelo de aprendizaje automático capacitado en citas mutuas, y en qué artículos han visto secuencialmente los usuarios de los estudiosos..Cuenta unos 8 millones de usuarios mensuales.
No más FOMO
Feedly, lanzado en 2008, también utiliza votos de forma y votos descendentes para saber qué nueva investigación académica es más relevante para el usuario, y beneficios de un asistente de IA que puede ser capacitado en palabras clave o temas específicos.Pero Feedly no está dirigido específicamente a los investigadores: tiene como objetivo ser un tablero que lo abarque todo para monitorear las noticias, RSS Feeds (que proporcionan una forma de alertar a los usuarios sobre el nuevo contenido en los sitios web), el foro en línea Reddit, Twitter y podcasts.Hay disponible una versión gratuita, pero las características adicionales, como la capacidad de seguir más de 100 fuentes y ocultar anuncios, cuestan US $ 6 o más al mes (a diferencia de la mayoría de las otras herramientas mencionadas aquí, que son completamente gratuitas; otra opción pagada esResearchGate +Plus, que aumenta la visibilidad de los usuarios y ofrece estadísticas avanzadas).
Las herramientas de inteligencia artificial tienen como objetivo domar la literatura del coronavirus
ResearchRabbit, which fully launched in August 2021, describes itself as “Spotify for papers".Los usuarios comienzan guardando documentos relevantes en una colección.Con cada artículo agregado, ResearchRabbit actualiza su lista de artículos recomendados, reflejando cómo la plataforma de transmisión de música hace recomendaciones basadas en las canciones que los usuarios agregan a sus listas de reproducción.La compañía detrás de esto, con sede en Seattle, Washington, no ha revelado exactamente cómo evalúa la relevancia, aunque dice que se centra en recomendaciones precisas en lugar de inundaciones de alertas. “We only want to send the most relevant papers to our users," says chief executive Michael Ma.
Amber Brown Ruiz, un estudiante de doctorado de educación especial y política de discapacidad en la Universidad de Virginia Commonwealth en Richmond, considera que las alertas de la rabia de investigación son más personalizadas que Google Scholar, que a veces alimenta sus documentos que son superficialmente similares a su propio trabajo, pero resultan serMuy lejos de su disciplina.
Ruiz también usa documentos conectados para encontrar nuevos artículos. She finds it to be less automated than Google Scholar, which sends fresh papers by e-mail, “but you can manually go in and figure out which articles are the newest", she says.
Lo que todas estas herramientas tienen en común es que usan algún tipo de inteligencia artificial para elaborar sus recomendaciones..Pero algunos estudiosos disfrutan del toque humano, valorando las recomendaciones de colegas y contactos en Twitter, por ejemplo.Researchgate, la plataforma de larga data que se marca a sí misma como una especie de red social para los científicos, dice que ofrece lo mejor de ambos mundos (Researchgate está en una asociación de intercambio de contenido con Springer Nature, que publica la naturaleza).
Hub Naturetech
Fundada en 2008, ResearchGate Bots Eorreos de recomendaciones de documentos y los sirve a través de una alimentación rodante cuando los usuarios están conectados.(Los usuarios también pueden ver una noticia cronológica de documentos publicados por sus contactos de investigación de investigación.) Aunque no hace público su algoritmo, utiliza información sobre las publicaciones de un usuario y qué publicaciones han visto en la plataforma para comprender sus intereses.Luego calcula artículos relacionados sobre la base de citas compartidas y temas extraídos y palabras clave.Researchgate actualmente incluye unas 149 millones de páginas de publicación y tiene 20 millones de usuarios.
“The secret sauce of ResearchGate is the combination of an active social network and a huge research graph," says Joseph Debruin, ResearchGate’s director of product management, who is based in Los Angeles, California.
Cinco años después de darse cuenta de que se estaba ahogando en nuevos documentos, Smolyansky finalmente puede sacudirse ese "miedo a perderse" científico. “You do not have to have that FOMO feeling," he says.