AWS og NVIDIA for at bringe Arm-baserede Graviton2-instanser med GPU'er til skyen

Kildeknude: 807655

AWS fortsætter med at innovere på vegne af vores kunder. Vi arbejder sammen med NVIDIA om at bringe en Arm-processor-baseret, NVIDIA GPU accelereret Amazon Elastic Compute Cloud (Amazon EC2) instans til skyen i anden halvdel af 2021. Denne instans vil indeholde den Arm-baserede AWS Graviton2 processor, som blev bygget fra bunden af ​​af AWS og optimeret til, hvordan kunderne kører deres arbejdsbelastninger i skyen, hvilket eliminerer en masse unødvendige komponenter, som ellers kunne gå ind i en processor til generelle formål.

AWS-innovation med Graviton2-processorer

AWS er ​​fortsat med at være pioner inden for cloud computing for vores kunder. I 2018 var AWS den første store cloud-udbyder til at tilbyde Arm-baserede instanser i skyen med EC2 A1-instanser drevet af AWS Graviton-processorer. Disse instanser er bygget op omkring armkerner og gør udstrakt brug af AWS specialbygget silicium. De passer godt til udskalering af arbejdsbelastninger, hvor du kan dele belastningen på tværs af en gruppe af mindre forekomster.

I 2020 udgav AWS AWS-designede, Arm-baserede Graviton2-processorer, der leverede et stort spring i ydeevne og muligheder i forhold til førstegenerations AWS Graviton-processorer. Disse processorer driver EC2-generelle formål (M6g, M6gd, T4g), computeroptimerede (C6g, C6gd, C6gn) og hukommelsesoptimerede (R6g, R6gd, X2gd) forekomster og giver op til 40 % bedre prisydelse i forhold til sammenlignelig strøm generation x86-baserede forekomster til en bred vifte af arbejdsbelastninger. AWS Graviton2-processorer leverer syv gange mere ydeevne, fire gange flere computerkerner, fem gange hurtigere hukommelse og caches dobbelt så store i forhold til førstegenerations AWS Graviton-processorer.

Kunder inklusive Domo, Formula One, Honeycomb.io, Intuit, LexisNexis Risk Solutions, Nielsen, NextRoll, Redbox, SmugMug, Snap og Twitter har set betydelige præstationsgevinster og reducerede omkostninger ved at køre AWS Graviton2-baserede instanser i produktionen. AWS Graviton2-processorer, baseret på 64-bit Arm-arkitekturen, understøttes af populære Linux-operativsystemer, herunder Amazon Linux 2, Red Hat, SUSE og Ubuntu. Mange populære applikationer og tjenester fra AWS og ISV'er understøtter også AWS Graviton2-baserede instanser. Armudviklere kan bruge disse instanser til at bygge applikationer indbygget i skyen, og derved eliminere behovet for emulering og krydskompilering, som er fejltilbøjelige og tidskrævende. Tilføjelse af NVIDIA GPU'er accelererer Graviton2-baserede instanser til forskellige cloud-arbejdsbelastninger, herunder spil og andre Arm-baserede arbejdsbelastninger som maskinlæring (ML) inferens.

Flyt nemt Android-spil til skyen

Ifølge forskning fra App Annie, mobilspil er nu den mest populære form for spil og har overhalet konsol, pc og Mac. Ekstra forskning fra App Annie har vist, at op til 10 % af al tid brugt på mobile enheder er med spil, og spiludviklere skal understøtte og optimere deres spil til det mangfoldige sæt af mobile enheder, der bliver brugt i dag og i fremtiden. Ved at udnytte skyen kan spiludviklere give en ensartet oplevelse på tværs af spektret af mobile enheder og forlænge batterilevetiden på grund af lavere computer- og strømkrav på mobilenheden. AWS Graviton2-instansen med NVIDIA GPU-acceleration gør det muligt for spiludviklere at køre Android-spil indbygget, kode den gengivede grafik og streame spillet over netværk til en mobilenhed, alt sammen uden at skulle køre emuleringssoftware på x86 CPU-baseret infrastruktur.

Omkostningseffektiv, GPU-baseret maskinlæringsslutning

Ud over mobilspil søger kunder, der kører maskinlæringsmodeller i produktionen, løbende efter måder at sænke omkostningerne, da ML-inferens kan repræsentere op til 90 % af det samlede infrastrukturforbrug til at køre disse applikationer i stor skala. Med dette nye tilbud vil kunderne være i stand til at drage fordel af pris/ydelsesfordelene ved Graviton2 til at implementere GPU-accelererede deep learning-modeller til en væsentlig lavere pris sammenlignet med x86-baserede instanser med GPU-acceleration.

AWS og NVIDIA: En lang historie med samarbejde

AWS og NVIDIA har samarbejdet i over 10 år for løbende at levere kraftfulde, omkostningseffektive og fleksible GPU-baserede løsninger til kunder, inklusive de nyeste EC2 G4 tilfælde med NVIDIA T4 GPU'er lanceret i 2019 og EC2 P4d-forekomster med NVIDIA A100 GPU'er, der blev lanceret i 2020. EC2 P4d-instanser er implementeret i hyperskaleringsklynger kaldet EC2 UltraClusters, der består af den højeste ydeevne computer, netværk og lagring i skyen. EC2 UltraClusters understøtter 400 Gbps instansnetværk, Elastic Fabric Adapter (EFA) og NVIDIA GPUDirect RDMA-teknologi for at hjælpe med hurtigt at træne ML-modeller ved hjælp af udskalering og distribuerede teknikker.

Ud over at være de første i skyen til at tilbyde GPU-accelererede instanser og først i skyen til at tilbyde NVIDIA V100 GPU'er, arbejder vi nu sammen med NVIDIA om at tilbyde nye EC2-instanser, der kombinerer en Arm-baseret processor med en GPU-accelerator i anden halvdel af 2021. For at lære mere om, hvordan AWS og NVIDIA arbejder sammen om at bringe innovativ teknologi til kunderne, kan du besøge AWS på NVIDIA GTC 21.


Om forfatteren

Geoff Murase er en Senior Product Marketing Manager for AWS EC2 accelererede computing-instanser, der hjælper kunder med at opfylde deres computerbehov ved at give adgang til hardwarebaserede computeracceleratorer såsom Graphics Processing Units (GPU'er) eller Field Programmable Gate Arrays (FPGA'er). I sin fritid nyder han at spille basketball og cykle med sin familie.

Kilde: https://aws.amazon.com/blogs/machine-learning/aws-and-nvidia-to-bring-arm-based-instances-with-gpus-to-the-cloud/

Tidsstempel:

Mere fra AWS Machine Learning Blog