La puce d’entraînement à l’IA de nouvelle génération d’Amazon est arrivée

Amazon Web Services a dévoilé Trainium3 et annoncé la disponibilité générale de ses puces Trainium2

Nous pouvons gagner une commission sur les liens sur cette page.
une image en gros plan de la puce d’IA Trainium 2
Trainium2
Photo: Amazon Web Services

Amazon Web Services a dévoilé sa puce d’entraînement à l’intelligence artificielle de nouvelle génération qui, selon elle, est plus rapide et devrait consommer moins d’énergie.

Publicité

Trainium3 est la première puce d’AWS construite avec le Procédé de 3 nanomètres — à ce jour la technologie de semiconducteurs la plus avancée — qui permet d’obtenir de meilleures performances et une meilleure efficacité énergétique. Les premières puces Trainium3 devraient être disponibles à la fin de l’année prochaine, a annoncé AWS lors de sa conférence re:Invent mardi.

Les UltraServers équipés de Trainium3 devraient être quatre fois plus performants que ceux équipés de ses puces Trainium2, a déclaré AWS, « permettant aux clients d’itérer encore plus rapidement lors de la création de modèles et de fournir des performances en temps réel supérieures lors de leur déploiement ».

Publicité

Les puces Trainium2 du géant du cloud, qui sont quatre fois plus rapides que son prédécesseur, sont désormais disponibles en version grand public, a déclaré AWS. Les instances Amazon Elastic Compute Cloud (Amazon EC2) alimentées par Trainium2 offrent un rapport prix/performances 30 à 40 % supérieur à celui des puces actuelles et comportent 16 puces Trainium2. Les nouvelles instances Amazon EC2 sont « idéales pour la formation et le déploiement de LLM avec des milliards de paramètres », a déclaré AWS.

Publicité

Le géant du cloud a annoncé qu’il construisait un cluster EC2 UltraCluster de serveurs Ultra alimentés par Trainium2 avec la start-up d’IA Anthropic, appelé Projet Rainier. En novembre, AWS a annoncé qu’il donnait suite à un précédent investissement de 4 milliards de dollars dans la start-up d’IA avec 4 milliards de dollars supplémentaires. Dans la prochaine phase du partenariat, Anthropic utilisera AWS comme principal partenaire de formation en IA.

Publicité

« Trainium2 est spécialement conçu pour prendre en charge les charges de travail d’IA générative les plus importantes et les plus avancées, à la fois pour la formation et l’inférence, et pour offrir le meilleur rapport prix/performance sur AWS », a déclaré David Brown, vice-président du calcul et de la mise en réseau chez AWS, dans un communiqué. « Avec des modèles approchant les milliards de « En plus de nos paramètres, nous comprenons que les clients ont également besoin d’une nouvelle approche pour former et exécuter ces charges de travail massives. Les nouveaux UltraServers Trn2 offrent les performances de formation et d’inférence les plus rapides sur AWS et aident les organisations de toutes tailles à former et à déployer les plus grands modèles du monde plus rapidement et à moindre coût. »

Le directeur général d’AWS, Matt Garman, a également annoncé la famille d’instances P6 de nouvelle génération de Nvidia et AWS, dotée des nouvelles puces Blackwell du fabricant de puces. Blackwell dispose d’une puissance de calcul 2,5 fois plus rapide que la génération actuelle d’unités de traitement graphique, ou GPU, a déclaré M. Garman.

Publicité

Ce contenu a été traduit automatiquement à partir du texte original. De légères différences résultant de la traduction automatique peuvent apparaître. Pour la version originale, cliquez ici.

Publicité