Technologie : Ces nouvelles puces, dotées d’une accélération de l’inférence de l’IA, leur permettront d’effectuer des tâches comme la détection de fraudes. Les premiers systèmes les utilisant sont prévus pour 2022.
Big Blue a dévoilé Telum, sa première puce dotée d’une accélération de l’inférence de l’IA, qui lui permettra d’effectuer des tâches comme la détection des fraudes pendant une transaction.
Une puce construite sur la technologie ultraviolet extrême de Samsung
« La puce contient 8 cœurs de processeur, avec un pipeline d’instructions hors service superscalaire profond, fonctionnant avec une fréquence d’horloge de plus de 5 GHz, optimisé pour les exigences des charges de travail hétérogènes des entreprises », indique IBM.
« L’infrastructure de cache et d’interconnexion des puces, entièrement repensée, fournit 32 Mo de cache par cœur, et peut évoluer jusqu’à 32 puces Telum. La conception du module à deux puces contient 22 milliards de transistors et 19 miles (environ 30 km, NDLR) de fils, sur 17 couches métalliques. »
La puce a été construite sur la technologie de l’ultraviolet extrême 7 nm, créée par Samsung, et représente la première participation de l’IBM Research AI Hardware Center.
En développement depuis trois ans, le premier système utilisant la puce est prévu pour le premier semestre 2022.
Des milliers de transactions par seconde
Anthony Saporito, membre du personnel technique principal pour le développement du matériel IBM Z, indique que les caches L2 peuvent se combiner et former un cache L3 virtuel de 256 Mo, et que jusqu’à 8 puces Telum peuvent se combiner pour former un cache L4 virtuel de 2 Go.
« L’une des principales innovations de la conception de Telum est que nous avons intégré un accélérateur d’intelligence artificielle directement dans le silicium de la puce, et que nous avons directement connecté tous les cœurs et construit un écosystème en amont, par le biais de la conception matérielle, des firmwares, des systèmes d’exploitation et des logiciels qui permettent d’intégrer cet apprentissage profond dans les transactions, toutes les transactions », raconte-t-il.
« Cette partie de la conception est le fruit d’une collaboration vraiment cool entre le groupe de recherche et le groupe des systèmes, et cette conception directement connectée, conçue pour l’apprentissage profond par inférence, nous permet de fonctionner à l’échelle. »
« Ces milliers et milliers de transactions par seconde… avec cette technologie, nous sommes en mesure de faire de l’inférence en apprentissage profond en temps réel, de la détection de fraude et de l’analyse, et d’obtenir des informations au fur et à mesure que ces transactions s’effectuent dans le système. Elle est également capable de le faire à l’échelle, et avec toute la fiabilité et l’absence de temps d’arrêt, ce qui est essentiel pour la plateforme. »
De 7 nm à 2 nm
En mai, IBM Research a créé un semi-conducteur de test avec une fabrication en 2 nm qui, selon Big Blue, améliorerait les performances de 45 % en utilisant la même quantité d’énergie, ou utiliserait 75 % d’énergie en moins par rapport aux puces 7 nm.
La technologie 2 nm entrera en production vers la fin de l’année 2024. Son utilisation massive pourrait avoir lieu vers 2025.
« C’est passionnant, car la plupart des fabricants les plus développés dans le monde travaillent sur 7 nm, certains sur 5 nm, et nous vous annonçons que nous sommes en train de développer une puce de 2 nm. Ce que ça signifie, c’est ce que l’industrie va continuer à progresser au cours de la prochaine décennie », se réjouissait à l’époque Mukesh Khare, vice-président d’IBM Research.
Source : net.fr/actualites/