AWS och NVIDIA för att få Arm-baserade Graviton2-instanser med GPU: er till molnet

Källnod: 807655

AWS fortsätter att förnya våra kunders räkning. Vi arbetar med NVIDIA för att få en Arm-processor-baserad, NVIDIA GPU-accelererad Amazon Elastic Compute Cloud (Amazon EC2) instans till molnet under andra halvan av 2021. Denna instans kommer att innehålla Arm-baserade AWS Graviton2-processor, som byggdes från grunden av AWS och optimerades för hur kunderna kör sina arbetsbelastningar i molnet, vilket eliminerar många onödiga komponenter som annars kan gå in i en universalprocessor.

AWS-innovation med Graviton2-processorer

AWS har fortsatt att vara banbrytande för cloud computing för våra kunder. År 2018 var AWS den första stora molnleverantören som erbjuder armbaserade instanser i molnet med EC2 A1-instanser som drivs av AWS Graviton-processorer. Dessa instanser är byggda runt armkärnor och använder omfattande AWS specialbyggt kisel. De passar utmärkt för att skala ut arbetsbelastningar där du kan dela belastningen över en grupp mindre instanser.

År 2020 släppte AWS AWS-designade, armbaserade Graviton2-processorer, vilket gav ett stort steg i prestanda och kapacitet jämfört med första generationens AWS Graviton-processorer. Dessa processorer driver EC2 allmänt ändamål (M6g, M6gd, T4g), beräkningsoptimerade (C6g, C6gd, C6gn) och minnesoptimerade (R6g, R6gd, X2gd) instanser och ger upp till 40% bättre prisprestanda jämfört med jämförbar ström generation x86-baserade instanser för en mängd olika arbetsbelastningar. AWS Graviton2-processorer levererar sju gånger mer prestanda, fyra gånger fler datorkärnor, fem gånger snabbare minne och cachar dubbelt så stora jämfört med första generationens AWS Graviton-processorer.

Kunder inklusive Domo, Formula One, Honeycomb.io, Intuit, LexisNexis Risk Solutions, Nielsen, NextRoll, Redbox, SmugMug, Snap och Twitter har sett betydande prestationsvinster och minskade kostnader från att köra AWS Graviton2-baserade instanser i produktionen. AWS Graviton2-processorer, baserade på 64-bitars Arm-arkitektur, stöds av populära Linux-operativsystem, inklusive Amazon Linux 2, Red Hat, SUSE och Ubuntu. Många populära applikationer och tjänster från AWS och ISV stöder också AWS Graviton2-baserade instanser. Armutvecklare kan använda dessa instanser för att bygga applikationer inbyggt i molnet, vilket eliminerar behovet av emulering och korskompilering, som är felbenägna och tidskrävande. Lägga till NVIDIA GPU: er accelererar Graviton2-baserade instanser för olika molnarbetsbelastningar, inklusive spel och andra armbaserade arbetsbelastningar som maskininlärning (ML).

Flytta enkelt Android-spel till molnet

Enligt forskning från App Annie, mobilspel är nu den mest populära spelformen och har gått förbi konsolen, PC och Mac. Ytterligare forskning från App Annie har visat att upp till 10% av all tid som spenderas på mobila enheter är med spel, och spelutvecklare behöver stödja och optimera sina spel för den olika uppsättningen mobila enheter som används idag och i framtiden. Genom att utnyttja molnet kan spelutvecklare ge en enhetlig upplevelse över spektrumet av mobila enheter och förlänga batteriets livslängd på grund av lägre beräknings- och kraftbehov på den mobila enheten. AWS Graviton2-instansen med NVIDIA GPU-acceleration gör det möjligt för spelutvecklare att köra Android-spel inbyggt, koda den renderade grafiken och strömma spelet över nätverk till en mobil enhet, allt utan att behöva köra emuleringsprogramvara på x86 CPU-baserad infrastruktur.

Kostnadseffektiv, GPU-baserad maskininlärningsinferens

Förutom mobilspel letar kunder som driver maskininlärningsmodeller i produktion kontinuerligt efter sätt att sänka kostnaderna eftersom ML-slutsats kan utgöra upp till 90% av den totala infrastrukturutgiften för att köra dessa applikationer i stor skala. Med detta nya erbjudande kommer kunderna att kunna dra nytta av fördelarna med pris / prestanda för Graviton2 för att distribuera GPU-accelererade deep learning-modeller till en betydligt lägre kostnad jämfört med x86-baserade instanser med GPU-acceleration.

AWS och NVIDIA: En lång samarbetshistoria

AWS och NVIDIA har samarbetat i över tio år för att kontinuerligt leverera kraftfulla, kostnadseffektiva och flexibla GPU-baserade lösningar till kunder inklusive de senaste EC2 G4-instanser med NVIDIA T4 GPU: er som lanserades 2019 och EC2 P4d-instanser med NVIDIA A100-grafikprocessorer som lanserades 2020. EC2 P4d-instanser distribueras i hyperskalakluster som kallas EC2 UltraClusters som består av högsta prestanda, nätverk och lagring i molnet. EC2 UltraClusters stöder 400 Gbps instansnätverk, EFA (Elastic Fabric Adapter) och NVIDIA GPUDirect RDMA-teknik för att snabbt träna ML-modeller med hjälp av skalnings- och distribuerade tekniker.

Förutom att vara först i molnet för att erbjuda GPU-accelererade instanser och först i molnet för att erbjuda NVIDIA V100 GPU, arbetar vi nu tillsammans med NVIDIA för att erbjuda nya EC2-instanser som kombinerar en Arm-baserad processor med en GPU-accelerator i andra hälften av 2021. För att lära dig mer om hur AWS och NVIDIA samarbetar för att få innovativ teknik till kunderna, besök AWS vid NVIDIA GTC 21.


Om författaren

Geoff Murase är en Senior Product Marketing Manager för AWS EC2-accelererade datorinstanser, som hjälper kunder att tillgodose deras beräknade behov genom att tillhandahålla tillgång till hårdvarubaserade datorer som grafikbearbetningsenheter (GPU) eller Field Programable Gate Arrays (FPGAs). På fritiden gillar han att spela basket och cykla med sin familj.

Källa: https://aws.amazon.com/blogs/machine-learning/aws-and-nvidia-to-bring-arm-based-instances-with-gpus-to-the-cloud/

Tidsstämpel:

Mer från AWS-maskininlärningsblogg