Discuter de l'apprentissage en essaim – ce qu'il est et ce qu'il fait – fait toujours apparaître des images de la nature. Et pour une bonne raison. C'est là que le concept puise son inspiration. Pensez aux essaims d'étourneaux bourdonnant dans le ciel, ou aux poissons nageant également dans l'eau. Le mot « essaim » a été inspiré par le fait que diverses créatures, souvent pour leur propre protection, présentent une sorte de comportement décentralisé sans rapport avec les mouvements de leur chef de troupeau. Et c'est la base de l'idée d'intelligence en essaim.
Aujourd'hui, nous définissons l'apprentissage en essaim comme une solution d'apprentissage automatique décentralisée conçue pour permettre aux entreprises d'exploiter la puissance des données distribuées tout en protégeant la confidentialité et la sécurité des données.
L'apprentissage en essaim exploite la puissance de calcul au niveau ou à proximité des sources de données distribuées. Il garantit la sécurité à l'aide de la technologie blockchain testée et protège la confidentialité en partageant les informations capturées à partir de modèles d'apprentissage en profondeur exécutés sur les données sources, au lieu des données brutes elles-mêmes. Les données restent locales. Seuls les apprentissages sont partagés. Cela se traduit par des modèles améliorés avec moins de biais car ils ont accès à un ensemble de données plus large - et résout les problèmes de confidentialité des données, de propriété des données et d'efficacité.
Avec le lancement récent de HPE Swarm Learning, la première solution de machine learning distribuée qui préserve la confidentialité du secteur,1 les avantages de Swarm Learning sont désormais disponibles pour les développeurs de modèles. Une blockchain autorisée est exploitée dans HPE Swarm Learning pour intégrer en toute sécurité les membres et élire dynamiquement le leader. Cela apporte résilience et sécurité au réseau en essaim.
Surmonter les défis d'une approche centralisée de l'apprentissage automatique
Comme on a tendance à le faire aujourd'hui, l'apprentissage automatique comporte de nombreux composants. Il y a une collecte de données, généralement à la périphérie. Ensuite, il y a l'agrégation des données, effectuée au centre de données principal où la formation du modèle d'IA est effectuée. Le modèle est ensuite déplacé vers le bord pour l'inférence afin de générer des prédictions. Cela génère un cycle continu, avec une énorme quantité de ressources nécessaires pour déplacer les données entre la périphérie et le centre de données. Cette approche signale des défis importants.
#1 Les données ne sont pas complètes en raison de problèmes de confidentialité des données et de réglementations qui empêchent le partage. La propriété des données par différentes organisations avec des politiques de données différentes conduit à un partage limité des données. De plus, les différences démographiques créent un biais dans les modèles de formation.
#2 Un biais est présent dans les données locales en raison d'une différence démographique. Cela signifie que les modèles formés aux nœuds locaux auront un biais intégré.
#3 La conception de la formation au modèle centralisé nécessite que les données soient déplacées vers un emplacement central, les apprentissages étant ensuite distribués aux nœuds pour la mise en œuvre. Il en résulte un déplacement massif des données et une duplication des données. Plus de problèmes surviennent dans les réseaux où la connectivité est mauvaise ou le mouvement de données intermittent est limité et non synchronisé.
Vous vous retrouvez face à une faible efficacité lorsque vous déployez des modèles en production. Vous finissez par solliciter les ressources réseau, de stockage et de calcul. En outre, les réglementations et les réglementations sur la confidentialité des données empêchent le mouvement des données et entraînent un manque de confidentialité des données. Les modèles résultants peuvent être sous-optimaux - avec un délai d'obtention des informations retardé, une précision globale inférieure et des modèles biaisés.
Un examen attentif de deux exemples sectoriels : la santé et la banque, montre plus précisément comment l'apprentissage en essaim résout ces problèmes.
Détection des maladies dans les soins de santé
Les organisations de soins de santé modernes exigent une précision accrue pour le diagnostic et les décisions de leurs solutions d'IA. Et pour atteindre la précision, l'IA nécessite l'accès à des ensembles de données plus volumineux afin de réduire les biais de données locaux. Sans agrégation de données à un emplacement, les résultats de modèles sous-optimaux conduisent à des décisions inexactes.
L'agrégation de données dans le domaine de la santé peut être particulièrement difficile, car les réglementations sur la confidentialité des données telles que HIPAA et GDPR empêchent le partage de données. La propriété des données empêche le partage entre les hôpitaux et entre les zones géographiques. Même lorsque les données peuvent être agrégées, des inefficacités surviennent en raison du coût du déplacement de très grandes données d'image de diagnostic utilisant une bande passante précieuse, et du fait que les données peuvent devoir être dupliquées en utilisant de précieuses ressources de stockage.
Avec HPE Swarm Learning, les organisations de santé peuvent effectuer une formation de modèle d'IA avec de grands ensembles de données distribuées à la source de données, sans aucun mouvement de données. La collaboration entre les sources de données peut se produire sans compromettre la confidentialité. Les données brutes ne sont pas partagées. Les problèmes de propriété des données sont éliminés, car chaque propriétaire de données participe en tant que partenaire égal. Les modèles améliorés fournissent une classification plus précise des maladies avec un biais réduit et un délai de précision globalement amélioré.
Dans ce cas d'utilisation spécifique axé sur l'examen des maladies pulmonaires de plusieurs patients, les données des patients ont été réparties sur trois zones géographiques. Les modèles d'un hôpital dans chaque emplacement n'ont pas réussi à détecter les maladies rarement observées. Les maladies pulmonaires peu fréquemment observées signifient que les données présentaient un biais local. Le modèle d'apprentissage en essaim a pu détecter ces maladies là où les hôpitaux disposaient de données limitées et supprimer le biais de données locales pour la catégorie. Même avec suffisamment de données disponibles, le modèle d'apprentissage en essaim est soit meilleur, soit au même niveau que n'importe quel modèle individuel.
Plus précisément, les images radiographiques pulmonaires ont été pré-étiquetées pour quatre maladies. Les modèles ont été formés localement dans chacun des trois hôpitaux. Chaque emplacement avec moins d'images pour la maladie particulière avait une précision inférieure d'environ 10 %. Même lorsque suffisamment d'images étaient disponibles, la précision était d'environ 60 %. L'apprentissage en essaim améliore la précision du modèle et le diagnostic ultérieur du patient et atteint une précision d'environ 70 %. C'est nettement mieux dans les cas où il y avait moins d'images et proches ou au pair lorsque suffisamment de données étaient disponibles.
Détection de la fraude par carte de crédit dans le secteur bancaire
L'intention d'un récent cas d'utilisation de démonstration était de développer un modèle d'apprentissage automatique pour détecter les fraudes dans les transactions par carte de crédit. Un ensemble de données accessible au public a été utilisé pour construire le modèle dans un environnement simulé avec trois réseaux de cartes de crédit. Les transactions frauduleuses étaient réparties sur les différents réseaux.
En fait, les réseaux de crédit individuels ne pouvaient pas voir toutes les transactions frauduleuses, et les données de transaction ne pouvaient pas être partagées entre les réseaux de crédit. En conséquence, les réseaux de crédit individuels ne pouvaient pas identifier toutes les transactions frauduleuses.
Grâce à l'apprentissage collaboratif, l'apprentissage en essaim a pu détecter toutes les transactions frauduleuses. Des performances significatives ont été obtenues par rapport aux modèles individuels avec des données et des biais limités.
Ces cas d'utilisation dans les secteurs de la santé et de la banque illustrent deux des nombreuses façons dont l'apprentissage en essaim offre une approche puissante de l'IA dans de nombreux secteurs, une approche qui associe des informations locales et mondiales tout en préservant la confidentialité et la propriété des données.
HPE apporte de nouvelles solutions d'IA révolutionnaires pour accélérer la modernisation axée sur les données de la périphérie au cloud, permettant ainsi d'étendre l'IA aux applications mondiales de taille industrielle. Nous concevons une IA basée sur les données, orientée vers la production et compatible avec le cloud, disponible à tout moment, n'importe où et à n'importe quelle échelle. Nos solutions prennent en charge les entreprises d'aujourd'hui ainsi que les services financiers, la santé et les sciences de la vie , et fabrication. HPE Swarm Learning apporte à votre entreprise un cadre décentralisé et préservant la confidentialité pour effectuer la formation du modèle d'apprentissage automatique à la source de données
1Une analyse effectuée le 13 avril 2022 des offres concurrentes qui revendiquent la préservation de la confidentialité a révélé qu'elles utilisaient une architecture fédérée reposant sur un serveur central.