AWS en NVIDIA om op Arm gebaseerde Graviton2-instanties met GPU's naar de cloud te brengen

Bronknooppunt: 807655

AWS blijft innoveren namens onze klanten. We werken samen met NVIDIA om een ​​op Arm-processor gebaseerde NVIDIA GPU-versnelling te bieden Amazon Elastic Compute-cloud (Amazon EC2) -instantie naar de cloud in de tweede helft van 2021. Deze instantie zal de Arm-gebaseerde AWS Graviton2-processor, dat vanaf de basis is opgebouwd door AWS en is geoptimaliseerd voor de manier waarop klanten hun workloads in de cloud uitvoeren, waardoor veel onnodige componenten worden geëlimineerd die anders in een processor voor algemene doeleinden zouden terechtkomen.

AWS-innovatie met Graviton2-processors

AWS is blijven pionieren in cloud computing voor onze klanten. In 2018 was AWS de eerste grote cloudprovider die op Arm gebaseerde instances in de cloud aanbood met EC2 A1-instances aangedreven door AWS Graviton-processors. Deze instanties zijn gebouwd rond Arm-kernen en maken uitgebreid gebruik van op maat gemaakt silicium van AWS. Ze zijn zeer geschikt voor scale-out workloads waarin u de load over een groep kleinere instances kunt verdelen.

In 2020 bracht AWS AWS-ontworpen, Arm-gebaseerde Graviton2-processors uit, die een grote sprong voorwaarts maakten in prestaties en mogelijkheden ten opzichte van de eerste generatie AWS Graviton-processors. Deze processors ondersteunen EC2-instances voor algemeen gebruik (M6g, M6gd, T4g), computergeoptimaliseerd (C6g, C6gd, C6gn) en geheugengeoptimaliseerd (R6g, R6gd, X2gd) en bieden tot 40% betere prijsprestaties dan vergelijkbare generatie x86-gebaseerde instances voor een breed scala aan workloads. AWS Graviton2-processors leveren zeven keer betere prestaties, vier keer meer rekenkernen, vijf keer sneller geheugen en twee keer zo grote caches dan de eerste generatie AWS Graviton-processors.

Klanten zoals Domo, Formula One, Honeycomb.io, Intuit, LexisNexis Risk Solutions, Nielsen, NextRoll, Redbox, SmugMug, Snap en Twitter hebben aanzienlijke prestatieverbeteringen en lagere kosten gezien door het uitvoeren van AWS Graviton2-gebaseerde instanties in productie. AWS Graviton2-processors, gebaseerd op de 64-bit Arm-architectuur, worden ondersteund door populaire Linux-besturingssystemen, waaronder Amazon Linux 2, Red Hat, SUSE en Ubuntu. Veel populaire applicaties en services van AWS en ISV's ondersteunen ook op AWS Graviton2 gebaseerde instances. Arm-ontwikkelaars kunnen deze instanties gebruiken om native applicaties in de cloud te bouwen, waardoor emulatie en cross-compilatie, die foutgevoelig en tijdrovend zijn, overbodig worden. Door NVIDIA GPU's toe te voegen, worden op Graviton2 gebaseerde instanties versneld voor diverse cloud-workloads, waaronder gaming en andere Arm-based workloads zoals inferentie van machine learning (ML).

Verplaats Android-games eenvoudig naar de cloud

Think onderzoek van App Annieis mobiel gamen nu de meest populaire vorm van gamen en heeft het de console, pc en Mac ingehaald. Extra onderzoek van App Annie heeft aangetoond dat tot 10% van alle tijd die op mobiele apparaten wordt doorgebracht met games is, en game-ontwikkelaars moeten hun games ondersteunen en optimaliseren voor de diverse reeks mobiele apparaten die nu en in de toekomst worden gebruikt. Door gebruik te maken van de cloud, kunnen game-ontwikkelaars een uniforme ervaring bieden over het hele spectrum van mobiele apparaten en de levensduur van de batterij verlengen vanwege lagere reken- en stroomvereisten van het mobiele apparaat. De AWS Graviton2-instantie met NVIDIA GPU-versnelling stelt game-ontwikkelaars in staat om Android-games native uit te voeren, de gerenderde grafische afbeeldingen te coderen en de game via netwerken naar een mobiel apparaat te streamen, allemaal zonder emulatiesoftware te hoeven draaien op x86 CPU-gebaseerde infrastructuur.

Kosteneffectieve, op GPU gebaseerde inferentie op basis van machine learning

Naast mobiel gamen, zijn klanten die machine learning-modellen in productie hebben, continu op zoek naar manieren om de kosten te verlagen, aangezien ML-inferentie tot 90% van de totale infrastructuuruitgaven voor het uitvoeren van deze applicaties op schaal kan vertegenwoordigen. Met dit nieuwe aanbod kunnen klanten profiteren van de prijs / prestatievoordelen van Graviton2 om GPU-versnelde deep learning-modellen te implementeren tegen aanzienlijk lagere kosten dan op x86-gebaseerde instanties met GPU-versnelling.

AWS en NVIDIA: een lange geschiedenis van samenwerking

AWS en NVIDIA werken al meer dan 10 jaar samen om voortdurend krachtige, kosteneffectieve en flexibele GPU-gebaseerde oplossingen aan klanten te leveren, waaronder de nieuwste EC2 G4-instanties met NVIDIA T4 GPU's gelanceerd in 2019 en EC2 P4d-instanties met NVIDIA A100 GPU's gelanceerd in 2020. EC2 P4d-instances worden geïmplementeerd in hyperscale clusters, EC2 UltraClusters genaamd, die bestaan ​​uit de best presterende rekenkracht, netwerken en opslag in de cloud. EC2 UltraClusters ondersteunen 400 Gbps instantienetwerken, Elastic Fabric Adapter (EFA) en NVIDIA GPUDirect RDMA-technologie om snel ML-modellen te trainen met behulp van scale-out en gedistribueerde technieken.

We zijn niet alleen de eerste in de cloud die GPU-versnelde instances aanbiedt en de eerste in de cloud die NVIDIA V100 GPU's aanbiedt, maar we werken nu samen met NVIDIA om nieuwe EC2-instances aan te bieden die een op Arm gebaseerde processor combineren met een GPU-accelerator in de tweede helft van 2021. Ga naar voor meer informatie over hoe AWS en NVIDIA samenwerken om innovatieve technologie naar klanten te brengen AWS bij NVIDIA GTC 21.


Over de auteur

Geoff Murase is Senior Product Marketing Manager voor AWS EC2-versnelde computerinstanties en helpt klanten om aan hun rekenbehoeften te voldoen door toegang te bieden tot op hardware gebaseerde rekenversnellers zoals grafische verwerkingseenheden (GPU's) of Field Programmable Gate Arrays (FPGA's). In zijn vrije tijd speelt hij graag basketbal en fietst hij met zijn gezin.

Bron: https://aws.amazon.com/blogs/machine-learning/aws-and-nvidia-to-bring-arm-based-instances-with-gpus-to-the-cloud/

Tijdstempel:

Meer van AWS Blog over machine learning