AWS et NVIDIA vont apporter des instances Graviton2 basées sur Arm avec GPU vers le cloud

Republié par Platon

Suiveurs: 0

AWS continue d'innover au nom de ses clients. Nous travaillons avec NVIDIA pour apporter un GPU NVIDIA basé sur un processeur Arm, accéléré Cloud de calcul élastique Amazon (Amazon EC2) dans le cloud au cours de la seconde moitié de 2021. Cette instance comportera le système basé sur Arm Processeur AWS Graviton2, qui a été conçu à partir de zéro par AWS et optimisé pour la façon dont les clients exécutent leurs charges de travail dans le cloud, éliminant ainsi de nombreux composants inutiles qui, autrement, pourraient entrer dans un processeur à usage général.

Innovation AWS avec les processeurs Graviton2

AWS a continué à être le pionnier du cloud computing pour ses clients. En 2018, AWS a été le premier grand fournisseur de cloud à proposer des instances basées sur Arm dans le cloud avec des instances EC2 A1 alimentées par des processeurs AWS Graviton. Ces instances sont construites autour des cœurs Arm et utilisent largement le silicium AWS personnalisé. Ils conviennent parfaitement aux charges de travail évolutives dans lesquelles vous pouvez partager la charge entre un groupe d'instances plus petites.

En 2020, AWS a lancé des processeurs Graviton2 basés sur Arm, conçus par AWS, offrant une avancée majeure en termes de performances et de capacités par rapport aux processeurs AWS Graviton de première génération. Ces processeurs alimentent les instances EC2 à usage général (M6g, M6gd, T4g), optimisés pour le calcul (C6g, C6gd, C6gn) et optimisés pour la mémoire (R6g, R6gd, X2gd), et offrent jusqu'à 40% de meilleures performances de prix par rapport à un courant comparable. génération d'instances x86 pour une grande variété de charges de travail. Les processeurs AWS Graviton2 offrent sept fois plus de performances, quatre fois plus de cœurs de calcul, une mémoire cinq fois plus rapide et des caches deux fois plus volumineuses que les processeurs AWS Graviton de première génération.

Des clients tels que Domo, Formula One, Honeycomb.io, Intuit, LexisNexis Risk Solutions, Nielsen, NextRoll, Redbox, SmugMug, Snap et Twitter ont constaté des gains de performances significatifs et une réduction des coûts liés à l'exécution d'instances basées sur AWS Graviton2 en production. Les processeurs AWS Graviton2, basés sur l'architecture Arm 64 bits, sont pris en charge par les systèmes d'exploitation Linux courants, notamment Amazon Linux 2, Red Hat, SUSE et Ubuntu. De nombreuses applications et services populaires d'AWS et d'ISV prennent également en charge les instances basées sur AWS Graviton2. Les développeurs Arm peuvent utiliser ces instances pour créer des applications de manière native dans le cloud, éliminant ainsi le besoin d'émulation et de compilation croisée, qui sont sources d'erreurs et prennent du temps. L'ajout de GPU NVIDIA accélère les instances basées sur Graviton2 pour diverses charges de travail cloud, y compris les jeux et d'autres charges de travail basées sur Arm comme l'inférence d'apprentissage automatique (ML).

Déplacez facilement les jeux Android vers le cloud

Selon recherche d'App Annie, le jeu mobile est désormais la forme de jeu la plus populaire et a dépassé la console, le PC et le Mac. Supplémentaire recherche d'App Annie a montré que jusqu'à 10% de tout le temps passé sur les appareils mobiles est consacré aux jeux, et les développeurs de jeux doivent prendre en charge et optimiser leurs jeux pour l'ensemble diversifié d'appareils mobiles utilisés aujourd'hui et à l'avenir. En tirant parti du cloud, les développeurs de jeux peuvent offrir une expérience uniforme sur tout le spectre des appareils mobiles et prolonger la durée de vie de la batterie en raison de la baisse des demandes de calcul et de puissance sur l'appareil mobile. L'instance AWS Graviton2 avec accélération GPU NVIDIA permet aux développeurs de jeux d'exécuter des jeux Android de manière native, d'encoder les graphiques rendus et de diffuser le jeu sur les réseaux sur un appareil mobile, le tout sans avoir besoin d'exécuter un logiciel d'émulation sur une infrastructure CPU x86.

Inférence de machine learning rentable basée sur GPU

Outre les jeux mobiles, les clients exécutant des modèles d'apprentissage automatique en production recherchent en permanence des moyens de réduire les coûts, car l'inférence ML peut représenter jusqu'à 90% des dépenses globales en infrastructure pour exécuter ces applications à grande échelle. Avec cette nouvelle offre, les clients pourront profiter des avantages prix / performances de Graviton2 pour déployer des modèles d'apprentissage profond accéléré par GPU à un coût nettement inférieur par rapport aux instances x86 avec accélération GPU.

AWS et NVIDIA: une longue histoire de collaboration

AWS et NVIDIA collaborent depuis plus de 10 ans pour fournir en permanence aux clients des solutions GPU puissantes, rentables et flexibles, y compris les dernières Instances EC2 G4 avec les GPU NVIDIA T4 lancés en 2019 et Instances EC2 P4d avec les GPU NVIDIA A100 lancés en 2020. Les instances EC2 P4d sont déployées dans des clusters hyperscale appelés EC2 UltraClusters qui comprennent les performances de calcul, de mise en réseau et de stockage les plus élevées dans le cloud. EC2 UltraClusters prend en charge la mise en réseau d'instances 400 Gbit / s, l'adaptateur Elastic Fabric Adapter (EFA) et la technologie NVIDIA GPUDirect RDMA pour aider à former rapidement des modèles ML à l'aide de techniques évolutives et distribuées.

En plus d'être les premiers dans le cloud à proposer des instances accélérées par GPU et les premiers dans le cloud à proposer des GPU NVIDIA V100, nous travaillons désormais avec NVIDIA pour proposer de nouvelles instances EC2 qui combinent un processeur basé sur Arm avec un accélérateur GPU dans le deuxième semestre 2021. Pour en savoir plus sur la manière dont AWS et NVIDIA travaillent ensemble pour offrir une technologie innovante aux clients, visitez AWS chez NVIDIA GTC 21.

À propos de l’auteur

Geoff Murase est un responsable principal du marketing produit pour les instances de calcul accéléré AWS EC2, aidant les clients à répondre à leurs besoins de calcul en fournissant un accès aux accélérateurs de calcul basés sur le matériel tels que les unités de traitement graphique (GPU) ou les tableaux de portes programmables sur le terrain (FPGA). Dans ses temps libres, il aime jouer au basket et faire du vélo avec sa famille.