Noyade dans la littérature?Ces outils logiciels intelligents peuvent aider

Chaque fois qu'Eddie Smolyansky avait quelques instants pour lui-même, il essayait de rester au courant de nouvelles publications dans son domaine.Mais d'ici 2016, le chercheur à vision informatique, basé à Tel Aviv, en Israël, recevait des centaines de recommandations de littérature automatisées par jour."À un moment donné, les pauses de salle de bain ne suffisaient pas", dit-il.Les recommandations étaient «beaucoup trop et impossibles à suivre».

La «fatigue du flux» de Smolyansky sera familière à de nombreux universitaires.Les outils d'alerte académique, à l'origine conçus pour concentrer l'attention sur les articles pertinents, sont eux-mêmes devenus un obstacle, inondant les boîtes de réception des scientifiques du monde entier.

«Je n'ai même pas lu mes recherches automatisées PubMed ces derniers temps parce que c'est vraiment écrasant», explique Craig Kaplan, biologiste à l'Université de Pittsburgh en Pennsylvanie.«Honnêtement, je ne peux pas rester au sommet de la littérature."

Mais le changement est en cours.En 2019, Smolyansky a cofondé Connected Papers, l'un d'une nouvelle génération d'outils de cartographie et de recommandation de littérature visuelle.D'autres services qui promettent à apprivoiser la surcharge d'informations, l'intégration des flux Twitter et des nouvelles quotidiennes ainsi que des recherches, sont également disponibles.

Histoire d'origine

Au lieu de servir une liste quotidienne de nouveaux articles par e-mail, les articles connectés utilisent un seul «papier d'origine» choisi par l'utilisateur pour construire une carte de la recherche connexe, basé en partie sur les citations qui se chevauchent.Le service a récemment dépassé un million d'utilisateurs, dit Smolyansky.

Les cartes sont codées par la couleur par date de publication, et les utilisateurs peuvent basculer entre les articles «antérieurs», les articles, et plus tard, «Dérivé», fonctionne qui s'appuie sur eux.L'idée est que les scientifiques peuvent rechercher un document d'origine qui les intéresse et voir sur la carte résultante que les articles récents ont fait sensation dans leur domaine, comment ils se rapportent à d'autres recherches et combien de citations ils ont accumulé.

TL; DR: Cette IA résume les documents de recherche dans une phrase

“You do not have to sit on the hose of papers and look at every paper that comes out for fear of missing it," says Smolyansky.L'outil est également utile lorsque les scientifiques veulent plonger dans un domaine entièrement nouveau, ajoute-t-il, offrant un aperçu de la littérature essentielle.

Un autre outil de cartographie visuelle est les cartes de connaissances ouvertes, un service offert par une organisation à but non lucratif basée à Vienne du même nom.Il a été fondé en 2015 par Peter Kraker, ancien chercheur de communication savante à l'Université de technologie de Graz en Autriche.

Les cartes de connaissances ouvertes crée ses cartes basées sur des mots clés plutôt que sur un article central, et s'appuie sur la similitude du texte et les métadonnées pour déterminer comment les articles sont liés.L'outil organise 100 articles dans des sous-champs similaires en bulles dont les positions relatives suggèrent une similitude;Une recherche d'articles sur le «changement climatique», par exemple, pourrait produire une bulle connexe sur la «cognition des risques».

Des cartes de ces bulles peuvent être construites en environ 20 secondes, et les utilisateurs peuvent les modifier pour inclure les 100 derniers articles de pertinence publiés, ou d'autres ressources.Les cartes de connaissances ouvertes comprennent non seulement des articles de revues, mais aussi du contenu tel que des ensembles de données et des logiciels de recherche.Ses utilisateurs ont créé plus de 400 000 cartes jusqu'à présent, explique Kraker.

Drowning in the literature? These smart software tools can help

Amie Fairs, qui étudie la langue à l'Université Aix-Marseille en France, est un passionné de cartes de connaissances ouvertes autoproclamées. “One particularly nice thing about Open Knowledge Maps is that you can search very broad topics, like ‘language production’, and it can group papers into themes you may not have considered," Fairs says.Par exemple, lorsqu'elle a recherché des «régions phonologiques du cerveau» - les domaines du cerveau qui traitent le son et le sens - des cartes de connaissances ouvertes ont suggéré un sous-champ de recherche sur les différences de traitement liées à l'âge. “I hadn’t considered looking in the ageing literature for information about this before, but now I will," she says.

Yet despite her enthusiasm for the service, Fairs still tends to find new papers through alerts from Google Scholar, the dominant tool in the field; it’s easier to go “down the rabbit hole", she explains, following a chain of papers that cite each other.

Cliquez pour recommander

Google Scholar recommande des articles en fonction des articles que les utilisateurs ont écrits et énumérez dans leurs profils. The algorithm isn’t public, but the company says that the recommendations are based on “the topics of your articles, the places where you publish, the authors you work with and cite, the authors that work in the same area as you and the citation graph".Les utilisateurs peuvent configurer manuellement des alertes e-mail supplémentaires en fonction des recherches de mots clés ou des auteurs particuliers.

Comment la technologie de l'IA peut apprivoiser la littérature scientifique

Aaron Tay, bibliothécaire de la Singapore Management University qui étudie les outils de recherche universitaire, obtient des recommandations de littérature de Twitter et Google Scholar, et constate que ce dernier met souvent en évidence les mêmes articles que ses collègues humains, bien que quelques jours plus tard. Google Scholar “is almost always on target", he says.

Besides published articles, Google Scholar might also pick up preprints as well as “low-quality theses and dissertations", Tay says. Even so, “you get some gems you might not have seen", he says.(Scopus, une base de données documentaire concurrente maintenue par l'éditeur basé à Amsterdam Elsevier, a commencé à intégrer des préparations plus tôt cette année, a déclaré un porte-parole.Mais cela n'indexe pas les thèses et les dissertations. “There will be titles that do not meet the Scopus standards but are covered by Google Scholar," he says.)

Google Scholar ne révèle pas la taille de sa base de données, mais il est largement reconnu comme le plus grand corpus existant, avec près de 400 millions d'articles par une estimation (M. Gusenbauer Scientometrics 118, 177–214; 2019).Les cartes de connaissances ouvertes, quant à eux, sont construites au-dessus du moteur de recherche académique Bielefeld open source, qui possède plus de 270 millions de documents, y compris des préimprimés, et est organisé pour éliminer le spam.

Les journaux connectés utilisent le corpus accessible au public compilé par Semantic Scholar - un outil mis en place en 2015 par l'Allen Institute for Artificial Intelligence à Seattle, Washington - s'élevant à environ 200 millions d'articles, y compris des préimprimés. Smolyansky acknowledges this size discrepancy means that “very rarely" Google Scholar will find “some niche 1970s paper" that Semantic Scholar does not.

Le système d'alerte de Semantic Scholar, appelé un flux de recherche adaptatif, construit une liste des articles recommandés que les utilisateurs peuvent former en aimant ou en n'aime pas les articles qu'ils voient.Pour décider quels articles sont similaires à ceux, il utilise un modèle d'apprentissage machine formé sur des citations mutuelles et sur quels articles les utilisateurs de chercheurs sémantiques ont vu séquentiellement.Cela compte quelque 8 millions d'utilisateurs mensuels.

Plus de FOMO

Feedly, lancé en 2008, utilise également des votes et des votes de descente pour savoir quelle nouvelle recherche universitaire est la plus pertinente pour l'utilisateur, et bénéficie d'un assistant d'IA qui peut être formé sur des mots clés ou des sujets spécifiques.Mais Feedly ne vise pas spécifiquement les chercheurs - il vise à être un tableau de bord global pour surveiller les nouvelles, RSS Feeds (qui fournissent un moyen d'alerter les utilisateurs de nouveaux contenus sur les sites Web), le forum en ligne Reddit, Twitter et les podcasts.Une version gratuite est disponible, mais des fonctionnalités supplémentaires, telles que la possibilité de suivre plus de 100 sources et de masquer les publicités, coûtent 6 $ US ou plus par mois (contrairement à la plupart des autres outils mentionnés ici, qui sont entièrement gratuits; une autre option payante estResearchGate + Plus, qui stimule la visibilité des utilisateurs et offre des statistiques avancées).

Les outils d'intelligence artificielle visent à apprivoiser la littérature sur le coronavirus

ResearchRabbit, which fully launched in August 2021, describes itself as “Spotify for papers".Les utilisateurs commencent en enregistrant des articles pertinents dans une collection.Avec chaque article ajouté, ResearchRabbit met à jour sa liste d'articles recommandés, reflétant la façon dont la plate-forme de diffusion musicale fait des recommandations basées sur les chansons que les utilisateurs ajoutent à leurs listes de lecture.L'entreprise derrière elle, basée à Seattle, Washington, n'a pas révélé exactement comment elle évalue la pertinence, bien qu'elle indique qu'elle se concentre sur des recommandations précises plutôt que sur des inondations d'alertes. “We only want to send the most relevant papers to our users," says chief executive Michael Ma.

Amber Brown Ruiz, étudiant doctoral spécial et handicapé-politique à la Virginia Commonwealth University à Richmond, trouve que les alertes Researchrabbit sont plus personnalisées que Google Scholar, qui nourrit parfois ses articles qui sont superficiellement similaires à son propre travail mais se révèlent êtreloin de sa discipline.

Ruiz utilise également des articles connectés pour trouver de nouveaux articles. She finds it to be less automated than Google Scholar, which sends fresh papers by e-mail, “but you can manually go in and figure out which articles are the newest", she says.

Ce que tous ces outils ont en commun, c'est qu'ils utilisent une sorte d'intelligence artificielle pour élaborer leurs recommandations.Mais certains chercheurs apprécient la touche humaine, valorisant les recommandations des collègues et des contacts sur Twitter, par exemple.ResearchGate, la plate-forme de longue date qui se marque comme une sorte de réseau social pour les scientifiques, dit qu'elle offre le meilleur des deux mondes (ResearchGate est en partenariat de partage de contenu avec Springer Nature, qui publie la nature).

Naturacech Hub

Fondée en 2008, ResearchGate a les deux recommandations par e-mail des articles et les sert via un flux roulant lorsque les utilisateurs sont connectés.(Les utilisateurs peuvent également voir un fil d'actualité chronologique des articles publiés par leurs contacts ResearchGate.) Bien qu'il ne rend pas son algorithme public à son algorithme, il utilise des informations sur les publications d'un utilisateur et quelles publications qu'ils ont consultées sur la plate-forme pour comprendre leurs intérêts.Il calcule ensuite des articles connexes sur la base de citations partagées et de sujets et de mots clés extraits.ResearchGate comprend actuellement quelque 149 millions de pages de publication et 20 millions d'utilisateurs.

“The secret sauce of ResearchGate is the combination of an active social network and a huge research graph," says Joseph Debruin, ResearchGate’s director of product management, who is based in Los Angeles, California.

Cinq ans après avoir réalisé qu'il se noyait dans de nouveaux articles, Smolyansky est enfin en mesure de se débarrasser de cette «peur de manquer» scientifique. “You do not have to have that FOMO feeling," he says.

Noyade dans la littérature?Ces outils logiciels intelligents peuvent aider

Histoire d'origine

Cliquez pour recommander

Plus de FOMO

What Features Matter in a Biking Action Camera?

Action Camera Stabilization and Video Quality Guide

Is a Phone Gimbal Worth It for Android Creators?