Intel déplace l'attention de ses processeurs de serveur vers une liste croissante de puces adjacentes qui entraînent un changement fondamental de l'informatique vers l'IA dans laquelle les réponses sont dérivées d'associations et de modèles trouvés dans données.
Les accélérateurs tels que les GPU et les puces IA ont été à l'honneur lors du récent événement Vision d'Intel près de Dallas. Intel modifie également la conception des puces pour qu'elle soit modulaire afin que les accélérateurs d'IA puissent être étroitement intégrés aux côtés de ses processeurs Xeon.
Le PDG Pat Gelsinger a cité l'IA comme la pierre angulaire de la future gamme de produits de l'entreprise. Il a invoqué l'ancien PDG Andy Grove lorsqu'il a prédit que l'IA - qui nécessite des niveaux de calcul plus élevés - sera un point d'inflexion clé dans les décisions stratégiques d'Intel.
L'informatique a évolué depuis l'introduction du 4004 - qui était le premier processeur d'Intel à être vendu en 1971 - et est désormais disponible du bout des doigts via le cloud et la périphérie, l'apprentissage automatique et l'IA fournissant des informations plus intelligentes, a déclaré Gelsinger.
"Nous assistons à cette explosion de cas d'utilisation. Si vous n'appliquez pas l'IA à chacun de vos processus métier, vous prenez du retard", a déclaré Gelsinger. "Nous devons nous assurer que les humains profitent de l'IA, mais les humains doivent également s'assurer que l'IA est meilleure et éthique également."
Carte mezzanine Habana Labs Gaudi2 d'Intel
L'entreprise s'appuie fortement sur les contributions de Google Cloud, d'Amazon Web Services et d'Azure de Microsoft pour piloter sa stratégie matérielle et logicielle d'IA. Le fabricant de puces a annoncé la puce Gaudi-2 AI et de nouvelles unités de traitement d'infrastructure (IPU) conçues avec des fournisseurs de cloud comme Google et Microsoft. La puce Gaudi-2 est basée sur des standards comme Ethernet, ce qui facilite son déploiement dans les infrastructures.
Intel a ajouté la gamme de puces Gaudi AI grâce à son acquisition en 2019 de Habana Labs. Les puces Gaudi de première génération sont désormais disponibles via des instances sur Amazon AWS, et cette relation a donné à Intel des indications sur la façon de concevoir Gaudi-2 pour prendre en charge les charges de travail hyperscaler, les exigences de sécurité et d'évolutivité.
"Nous avons beaucoup appris de l'engagement avec Amazon", a déclaré Eitan Medina, directeur de l'exploitation chez Habana Labs, lors d'une conférence de presse à Vision.
Intel a également clairement indiqué qu'il ne pouvait pas se contenter de vendre des puces, mais avait également besoin d'une stratégie logicielle pour superposer ses offres matérielles.
"Intel a essayé d'unifier les logiciels sur les nombreuses plates-formes matérielles. Cela continue d'évoluer", a déclaré Kevin Krewell, analyste chez Tirias Research.
Le fabricant de puces a annoncé Project Amber, un nouveau service qui crée une bulle sécurisée dans laquelle les clients peuvent exécuter des modèles d'IA en toute sécurité sans se soucier des fuites de données vers des parties non autorisées. La technologie authentifie tous les points de connexion et sera proposée en tant que service de vérification dans des services à un ou plusieurs nuages pour protéger les données.
Le projet Amber nécessite une collaboration étroite entre les services matériels et logiciels d'Intel, et la technologie permettra aux entreprises d'exécuter des modèles d'apprentissage automatique dans un environnement cloud sécurisé et fiable, a déclaré Greg Lavender, directeur de la technologie d'Intel, dans un discours liminaire.
"Le coût du développement de modèles d'IA peut aller de 10 000 $ à 10 millions de dollars. La protection de cette propriété intellectuelle est une priorité absolue pour ces utilisateurs et ces applications", a déclaré Lavender.
Lavender a ensuite parlé d'OpenVINO, une boîte à outils d'inférence d'IA, utilisée avec le SGX (Software Guard Extensions) et d'autres technologies pour sécuriser l'IA en périphérie. SGX fournit une couche de protection supplémentaire afin que les parties non autorisées n'aient pas accès aux données.
Intel a également fourni des exemples de la manière dont ses logiciels et matériels d'IA aident les entreprises à se conformer aux exigences réglementaires. Intel a annoncé un partenariat avec BeeKeeperAI pour les fournisseurs de soins de santé afin d'exécuter l'apprentissage automatique à la périphérie, qui pourrait souvent tomber en dehors des environnements de confiance. L'offre conjointe, qui se trouve sur le cloud Azure de Microsoft, aide les prestataires de soins de santé à se conformer aux exigences réglementaires en matière de confidentialité des données.
La technologie SGX d'Intel a permis à Bosch USA, qui développe des technologies pour les voitures autonomes, de déployer des modèles de formation dans un environnement privé. Les modèles d'IA utilisent des données du monde réel et des données synthétiques générées par la machine tout en masquant des informations telles que les données faciales. La société a également déployé des modèles d'IA pour les systèmes critiques pour la sécurité dans la conduite autonome, qui ont également des exigences réglementaires, a déclaré Tim Frasier, président des solutions informatiques inter-domaines chez Bosch, qui s'est exprimé sur scène lors de la conférence.
GPU Intel Artic Sound-M
Intel a également annoncé le processeur graphique Arctic Sound-M, qui est conçu pour être mis en œuvre dans les centres de données pour l'IA, les flux vidéo et les jeux en nuage.
Le GPU peut exécuter 150 000 milliards d'opérations par seconde pour le traitement vidéo et IA. "Ainsi, tout en faisant ce streaming, vous pourriez utiliser l'IA pour comprendre ce qu'il y a dans la vidéo", a déclaré Raja Koduri, vice-président exécutif et directeur général du groupe Accelerated Computing Systems and Graphics chez Intel, lors de la conférence.
La vidéo consomme beaucoup de trafic Internet, mais elle est également utilisée pour des applications telles que l'analyse des données capturées par les caméras.
"Nous exécutons également davantage d'analyses d'IA sur les flux vidéo", a déclaré Koduri, ajoutant que "Ces nouveaux cas d'utilisation exigent une nouvelle accélération matérielle car ils sont en temps réel avec l'IA."
Le GPU sera disponible en deux configurations : un modèle de 150 watts avec 32 cœurs Xe et un modèle de 75 watts avec 16 cœurs Xe. Les GPU ont Xe Matrix Extensions (XMX) pour l'accélération de l'IA.
Arctic Sound-M prend en charge une plate-forme de développement logiciel appelée OneAPI, qui prend en charge un large éventail de cadres de programmation d'IA, notamment TensorFlow et Caffe.
OneAPI est un ingrédient clé pour qu'Intel réussisse dans l'IA, a déclaré Krewell de Tirias Research, ajoutant que "Nvidia CUDA reste la référence en matière de piles de logiciels de fournisseurs".
Les nouvelles puces IA sont essentielles pour l'avenir d'Intel alors qu'il tente de rattraper Nvidia, qui a une longueur d'avance dans le traitement de l'IA. Pour accueillir de nouveaux accélérateurs, Intel adopte une approche modulaire de la conception des puces, dans laquelle la société peut regrouper une gamme de GPU, ASIC ou FPGA maison aux côtés de puces Xeon.
"La première chose qui est nécessaire est une approche modulaire, car différentes solutions d'IA sont nécessaires", a déclaré Bob Brennan, vice-président et directeur général des services de fonderie d'Intel, lors d'une session en petits groupes chez Vision.
Brennan dirige un effort visant à diversifier les puces Intel en intégrant la prise en charge des accélérateurs d'intelligence artificielle basés sur les architectures RISC-V ou Arm. La société propose déjà des FPGA pour les applications d'IA et travaille sur des puces neuromorphiques inspirées du fonctionnement du cerveau humain.
Intel dispose déjà d'une telle puce modulaire nommée Ponte Vecchio, un accélérateur qui intègre des cœurs graphiques, des processeurs vectoriels, des E/S, des réseaux, des moteurs matriciels et d'autres cœurs de traitement dans un seul boîtier. La société partagera plus de détails sur la puce lors de la prochaine conférence ISC High-Performance Computing qui débutera plus tard ce mois-ci.
"La modularité commence par votre architecture. Lorsque vous visualisez l'architecture de votre ordinateur et la façon dont vous allez construire votre SoC, vous devez penser au partitionnement potentiel", a déclaré Brennan.
La stratégie matérielle d'IA d'Intel est également liée à des interfaces standard.
"Si vous comparez l'architecture de Gaudi, nous avons pris l'engagement d'utiliser Ethernet car c'est l'interface la plus largement utilisée qui permettra aux clients d'évoluer en utilisant une interface standard plutôt qu'une interface propriétaire", a déclaré Medina de Habana Labs.
Intel prend également en charge l'interface UCIe (Universal Chiplet Interconnect Express) à l'intérieur du boîtier de puces pour connecter des accélérateurs d'IA partitionnés, des processeurs et d'autres coprocesseurs.
L'année dernière, Intel a créé un nouveau groupe commercial appelé Accelerated Computing Systems and Graphics Group, dirigé par Koduri, pour se concentrer sur les GPU, les accélérateurs et les puces IA. Les puces Xeon d'Intel dominent toujours l'infrastructure des centres de données (avec une part de 85 % selon l'estimation d'Intel), fournissant une base installée massive sur laquelle la société espère vendre ses puces IA.
Mais l'entreprise a eu sa part de difficultés avec les produits d'IA. La société a acheté la startup de puces AI Nervana en 2016, mais a interrompu la gamme de produits au début de 2020, peu de temps après que Gelsinger soit devenu le PDG. Gelsinger a réinitialisé les opérations d'Intel en mettant l'accent sur la fabrication, l'ingénierie et la recherche et développement.
Gelsinger a reconnu qu'Intel était toujours en train de trier ses multiples offres d'IA, les cas d'utilisation et les exigences des clients.
"Arctic Sound arrive également. Il y aura des cas où il sera en concurrence avec Gaudi. Nous devons les trier au fur et à mesure que nous affrontons le client car ils ont des couloirs de nage très solides à part entière ", a déclaré Gelsinger lors d'une conférence de presse.