AWS og NVIDIA for å bringe Arm-baserte Graviton2-forekomster med GPUer til skyen

Kilde node: 807655

AWS fortsetter å innovere på vegne av kundene våre. Vi jobber med NVIDIA for å få en Arm-prosessorbasert, NVIDIA GPU-akselerert Amazon Elastic Compute Cloud (Amazon EC2) forekomst til skyen i andre halvdel av 2021. Denne forekomsten vil inneholde den Arm-baserte AWS Graviton2-prosessor, som ble bygget fra grunnen av av AWS og optimalisert for hvordan kundene kjører arbeidsmengdene sine i skyen, og eliminerer mange unødvendige komponenter som ellers kan gå inn i en prosessor for generell bruk.

AWS-innovasjon med Graviton2-prosessorer

AWS har fortsatt å være banebrytende innen cloud computing for våre kunder. I 2018 var AWS den første store skyleverandøren som tilbyr Arm-baserte forekomster i skyen med EC2 A1-forekomster drevet av AWS Graviton-prosessorer. Disse forekomstene er bygget rundt armkjerner og bruker mye AWS spesialbygd silisium. De passer utmerket for utskalering av arbeidsbelastninger der du kan dele belastningen på tvers av en gruppe mindre forekomster.

I 2020 ga AWS ut AWS-designede, Arm-baserte Graviton2-prosessorer, som leverer et stort sprang i ytelse og kapasitet i forhold til førstegenerasjons AWS Graviton-prosessorer. Disse prosessorene driver EC2 generelle formål (M6g, M6gd, T4g), dataoptimaliserte (C6g, C6gd, C6gn) og minneoptimaliserte (R6g, R6gd, X2gd) forekomster, og gir opptil 40 % bedre prisytelse i forhold til sammenlignbar strøm generasjon x86-baserte forekomster for et bredt utvalg av arbeidsbelastninger. AWS Graviton2-prosessorer leverer syv ganger mer ytelse, fire ganger flere datakjerner, fem ganger raskere minne og cacher dobbelt så store enn førstegenerasjons AWS Graviton-prosessorer.

Kunder inkludert Domo, Formula One, Honeycomb.io, Intuit, LexisNexis Risk Solutions, Nielsen, NextRoll, Redbox, SmugMug, Snap og Twitter har sett betydelige ytelsesgevinster og reduserte kostnader ved å kjøre AWS Graviton2-baserte forekomster i produksjon. AWS Graviton2-prosessorer, basert på 64-bit Arm-arkitekturen, støttes av populære Linux-operativsystemer, inkludert Amazon Linux 2, Red Hat, SUSE og Ubuntu. Mange populære applikasjoner og tjenester fra AWS og ISV-er støtter også AWS Graviton2-baserte forekomster. Arm-utviklere kan bruke disse forekomstene til å bygge applikasjoner naturlig i skyen, og dermed eliminere behovet for emulering og krysskompilering, som er utsatt for feil og tidkrevende. Å legge til NVIDIA GPU-er akselererer Graviton2-baserte forekomster for ulike skyarbeidsbelastninger, inkludert spill og andre armbaserte arbeidsbelastninger som maskinlæring (ML) inferens.

Flytt enkelt Android-spill til skyen

Ifølge forskning fra App Annie, er mobilspill nå den mest populære formen for spill og har gått forbi konsoll, PC og Mac. Ytterligere forskning fra App Annie har vist at opptil 10 % av all tid brukt på mobile enheter er med spill, og spillutviklere må støtte og optimalisere spillene sine for det mangfoldige settet med mobile enheter som brukes i dag og i fremtiden. Ved å utnytte skyen kan spillutviklere gi en enhetlig opplevelse på tvers av spekteret av mobile enheter og forlenge batterilevetiden på grunn av lavere data- og strømbehov på mobilenheten. AWS Graviton2-forekomsten med NVIDIA GPU-akselerasjon gjør det mulig for spillutviklere å kjøre Android-spill innebygd, kode den gjengitte grafikken og streame spillet over nettverk til en mobilenhet, alt uten å måtte kjøre emuleringsprogramvare på x86 CPU-basert infrastruktur.

Kostnadseffektiv, GPU-basert maskinlæringsslutning

I tillegg til mobilspilling, leter kunder som kjører maskinlæringsmodeller i produksjon kontinuerlig etter måter å redusere kostnadene på ettersom ML-slutninger kan representere opptil 90 % av det totale infrastrukturforbruket for å kjøre disse applikasjonene i stor skala. Med dette nye tilbudet vil kunder kunne dra nytte av pris/ytelsesfordelene ved Graviton2 for å distribuere GPU-akselererte dyplæringsmodeller til en betydelig lavere kostnad sammenlignet med x86-baserte forekomster med GPU-akselerasjon.

AWS og NVIDIA: En lang historie med samarbeid

AWS og NVIDIA har samarbeidet i over 10 år for å kontinuerlig levere kraftige, kostnadseffektive og fleksible GPU-baserte løsninger til kunder, inkludert de nyeste EC2 G4-forekomster med NVIDIA T4 GPUer lansert i 2019 og EC2 P4d-forekomster med NVIDIA A100 GPUer lansert i 2020. EC2 P4d-forekomster distribueres i hyperskaleringsklynger kalt EC2 UltraClusters som består av databehandling, nettverk og lagring med høyeste ytelse i skyen. EC2 UltraClusters støtter 400 Gbps forekomstnettverk, Elastic Fabric Adapter (EFA) og NVIDIA GPUDirect RDMA-teknologi for å hjelpe raskt å trene ML-modeller ved å bruke utskalering og distribuerte teknikker.

I tillegg til å være først i skyen som tilbyr GPU-akselererte instanser og først i skyen som tilbyr NVIDIA V100 GPUer, jobber vi nå sammen med NVIDIA for å tilby nye EC2-instanser som kombinerer en Arm-basert prosessor med en GPU-akselerator i andre halvdel av 2021. For å lære mer om hvordan AWS og NVIDIA samarbeider for å bringe innovativ teknologi til kunder, besøk AWS på NVIDIA GTC 21.


om forfatteren

Geoff Murase er en Senior Product Marketing Manager for AWS EC2 akselererte databehandlingsforekomster, og hjelper kunder med å møte deres beregne behov ved å gi tilgang til maskinvarebaserte datamaskin-akseleratorer som grafikkprosesseringsenheter (GPU-er) eller feltprogrammerbare gate-arrays (FPGA-er). På fritiden liker han å spille basketball og sykle med familien.

Kilde: https://aws.amazon.com/blogs/machine-learning/aws-and-nvidia-to-bring-arm-based-instances-with-gpus-to-the-cloud/

Tidstempel:

Mer fra AWS maskinlæringsblogg