AWS și NVIDIA vor aduce în cloud instanțele Graviton2 bazate pe Arm cu GPU

Nodul sursă: 807655

AWS continuă să inoveze în numele clienților noștri. Lucrăm cu NVIDIA pentru a aduce un procesor Arm, accelerat GPU NVIDIA Cloud Elastic de calcul Amazon Instanță (Amazon EC2) către cloud în a doua jumătate a anului 2021. Această instanță va prezenta aplicația bazată pe Arm procesor AWS Graviton2, care a fost construit de la zero de AWS și optimizat pentru modul în care clienții își desfășoară sarcinile de lucru în cloud, eliminând o mulțime de componente inutile care altfel ar putea intra într-un procesor de uz general.

Inovație AWS cu procesoare Graviton2

AWS a continuat să fie pionier în cloud computing pentru clienții noștri. În 2018, AWS a fost primul furnizor important de cloud care a oferit instanțe bazate pe Arm în cloud cu instanțe EC2 A1 alimentate de procesoare AWS Graviton. Aceste instanțe sunt construite în jurul miezurilor Arm și folosesc pe scară largă siliciul personalizat AWS. Se potrivesc perfect pentru sarcinile de lucru cu scalabilitate în care puteți partaja sarcina într-un grup de instanțe mai mici.

În 2020, AWS a lansat procesoare Graviton2 proiectate de AWS, bazate pe Arm, oferind un salt major în performanță și capabilități față de procesoarele AWS Graviton de prima generație. Aceste procesoare alimentează instanțe EC2 de uz general (M6g, M6gd, T4g), optimizate pentru calcul (C6g, C6gd, C6gn) și optimizate pentru memorie (R6g, R6gd, X2gd) și oferă performanțe de preț cu până la 40% mai bune față de curentul comparabil instanțe bazate pe generație x86 pentru o mare varietate de sarcini de lucru. Procesoarele AWS Graviton2 oferă de șapte ori mai multe performanțe, de patru ori mai multe nuclee de calcul, memorie de cinci ori mai rapidă și cache de două ori mai mari decât procesoarele AWS Graviton de prima generație.

Clienți, printre care Domo, Formula One, Honeycomb.io, Intuit, LexisNexis Risk Solutions, Nielsen, NextRoll, Redbox, SmugMug, Snap și Twitter au înregistrat câștiguri semnificative de performanță și costuri reduse în urma rulării instanțelor bazate pe AWS Graviton2 în producție. Procesoarele AWS Graviton2, bazate pe arhitectura Arm pe 64 de biți, sunt acceptate de sistemele de operare Linux populare, inclusiv Amazon Linux 2, Red Hat, SUSE și Ubuntu. Multe aplicații și servicii populare de la AWS și ISV-uri acceptă, de asemenea, instanțe bazate pe AWS Graviton2. Dezvoltatorii Arm pot folosi aceste instanțe pentru a construi aplicații nativ în cloud, eliminând astfel nevoia de emulare și compilare încrucișată, care sunt predispuse la erori și consumatoare de timp. Adăugarea de GPU-uri NVIDIA accelerează instanțe bazate pe Graviton2 pentru diverse sarcini de lucru în cloud, inclusiv jocuri și alte sarcini de lucru bazate pe Arm, cum ar fi inferența de învățare automată (ML).

Mutați cu ușurință jocurile Android în cloud

În conformitate cu cercetare de la App Annie, jocurile mobile sunt acum cea mai populară formă de joc și au depășit consolele, PC-urile și Mac. Adiţional cercetare de la App Annie a arătat că până la 10% din timpul petrecut pe dispozitive mobile este cu jocuri, iar dezvoltatorii de jocuri trebuie să-și susțină și să-și optimizeze jocurile pentru setul divers de dispozitive mobile folosite astăzi și în viitor. Folosind cloud-ul, dezvoltatorii de jocuri pot oferi o experiență uniformă pe întregul spectru de dispozitive mobile și pot prelungi durata de viață a bateriei datorită necesităților mai mici de calcul și energie pe dispozitivul mobil. Instanța AWS Graviton2 cu accelerare GPU NVIDIA le permite dezvoltatorilor de jocuri să ruleze jocuri Android în mod nativ, să codifice grafica redată și să transmită jocul prin rețele pe un dispozitiv mobil, totul fără a fi nevoie să ruleze software de emulare pe infrastructura bazată pe CPU x86.

Inferență de învățare automată, rentabilă, bazată pe GPU

Pe lângă jocurile mobile, clienții care rulează modele de învățare automată în producție caută în mod continuu modalități de a reduce costurile, deoarece inferența ML poate reprezenta până la 90% din cheltuielile totale de infrastructură pentru rularea acestor aplicații la scară. Cu această nouă ofertă, clienții vor putea profita de avantajele preț/performanță ale Graviton2 pentru a implementa modele de deep learning accelerate GPU la un cost semnificativ mai mic față de instanțe bazate pe x86 cu accelerare GPU.

AWS și NVIDIA: O lungă istorie de colaborare

AWS și NVIDIA au colaborat de peste 10 ani pentru a oferi în permanență clienților soluții puternice, eficiente și flexibile bazate pe GPU, inclusiv cele mai recente Instanțele EC2 G4 cu GPU-uri NVIDIA T4 lansate în 2019 și Instanțele EC2 P4d cu GPU-uri NVIDIA A100 lansate în 2020. Instanțele EC2 P4d sunt implementate în clustere hiperscale numite EC2 UltraClusters care sunt compuse din cele mai înalte performanțe de calcul, rețea și stocare în cloud. EC2 UltraClusters acceptă rețea de instanțe de 400 Gbps, Elastic Fabric Adapter (EFA) și tehnologia NVIDIA GPUDirect RDMA pentru a ajuta la antrenarea rapidă a modelelor ML folosind tehnici de scalare și distribuite.

Pe lângă faptul că suntem primii în cloud care oferă instanțe accelerate GPU și primii în cloud care oferă GPU-uri NVIDIA V100, acum lucrăm împreună cu NVIDIA pentru a oferi noi instanțe EC2 care combină un procesor bazat pe Arm cu un accelerator GPU în a doua jumătate a anului 2021. Pentru a afla mai multe despre modul în care AWS și NVIDIA lucrează împreună pentru a aduce tehnologie inovatoare clienților, vizitați AWS la NVIDIA GTC 21.


Despre autor

Geoff Murase este un senior manager de marketing de produse pentru instanțele de calcul accelerat AWS EC2, ajutând clienții să-și îndeplinească nevoile de calcul, oferind acces la acceleratoare de calcul bazate pe hardware, cum ar fi Unități de procesare grafică (GPU) sau Gate Arme programabile de câmp (FPGA). În timpul liber, îi place să joace baschet și să facă ciclism cu familia.

Sursa: https://aws.amazon.com/blogs/machine-learning/aws-and-nvidia-to-bring-arm-based-instances-with-gpus-to-the-cloud/

Timestamp-ul:

Mai mult de la Blog de AWS Machine Learning