AWS e NVIDIA para trazer instâncias Graviton2 baseadas em Arm com GPUs para a nuvem

Nó Fonte: 807655

A AWS continua inovando em nome de nossos clientes. Estamos trabalhando com a NVIDIA para trazer um GPU acelerado NVIDIA baseado no processador Arm Amazon Elastic Compute Nuvem (Amazon EC2) para a nuvem na segunda metade de 2021. Esta instância contará com o modelo Arm-based Processador AWS Graviton2, que foi desenvolvido desde o início pela AWS e otimizado para a forma como os clientes executam suas cargas de trabalho na nuvem, eliminando muitos componentes desnecessários que, de outra forma, poderiam ir para um processador de uso geral.

Inovação AWS com processadores Graviton2

A AWS continuou a ser pioneira na computação em nuvem para nossos clientes. Em 2018, a AWS foi o primeiro grande provedor de nuvem a oferecer instâncias baseadas em Arm na nuvem com instâncias EC2 A1 com processadores AWS Graviton. Essas instâncias são construídas em torno de núcleos Arm e fazem uso extensivo de silício personalizado da AWS. Eles são ideais para cargas de trabalho de scale-out, nas quais você pode compartilhar a carga em um grupo de instâncias menores.

Em 2020, a AWS lançou os processadores Graviton2 desenvolvidos pela AWS e baseados em Arm, proporcionando um grande salto em desempenho e recursos em relação aos processadores Graviton de primeira geração da AWS. Esses processadores alimentam instâncias EC2 de uso geral (M6g, M6gd, T4g), otimizados para computação (C6g, C6gd, C6gn) e otimizados para memória (R6g, R6gd, X2gd) e fornecem desempenho de preço até 40% melhor em relação à corrente comparável geração de instâncias baseadas em x86 para uma ampla variedade de cargas de trabalho. Os processadores AWS Graviton2 oferecem sete vezes mais desempenho, quatro vezes mais núcleos de computação, memória cinco vezes mais rápida e caches duas vezes maiores do que os processadores AWS Graviton de primeira geração.

Clientes como Domo, Fórmula Um, Honeycomb.io, Intuit, LexisNexis Risk Solutions, Nielsen, NextRoll, Redbox, SmugMug, Snap e Twitter viram ganhos de desempenho significativos e custos reduzidos ao executar instâncias baseadas em AWS Graviton2 em produção. Os processadores AWS Graviton2, baseados na arquitetura Arm de 64 bits, são suportados por sistemas operacionais Linux populares, incluindo Amazon Linux 2, Red Hat, SUSE e Ubuntu. Muitos aplicativos e serviços populares de AWS e ISVs também oferecem suporte a instâncias baseadas em AWS Graviton2. Os desenvolvedores do Arm podem usar essas instâncias para construir aplicativos nativamente na nuvem, eliminando assim a necessidade de emulação e compilação cruzada, que são propensas a erros e demoradas. Adicionar GPUs NVIDIA acelera instâncias baseadas em Graviton2 para diversas cargas de trabalho em nuvem, incluindo jogos e outras cargas de trabalho baseadas em Arm, como inferência de aprendizado de máquina (ML).

Mova jogos Android para a nuvem com facilidade

De acordo com o pesquisa da App Annie, os jogos móveis são agora a forma mais popular de jogos e ultrapassaram o console, PC e Mac. Adicional pesquisa da App Annie mostrou que até 10% de todo o tempo gasto em dispositivos móveis é com jogos, e os desenvolvedores de jogos precisam oferecer suporte e otimizar seus jogos para o conjunto diversificado de dispositivos móveis usados ​​hoje e no futuro. Aproveitando a nuvem, os desenvolvedores de jogos podem fornecer uma experiência uniforme em todo o espectro de dispositivos móveis e estender a vida útil da bateria devido à menor demanda de computação e energia no dispositivo móvel. A instância AWS Graviton2 com aceleração de GPU NVIDIA permite que os desenvolvedores de jogos executem jogos Android nativamente, codifiquem os gráficos renderizados e transmitam o jogo pelas redes para um dispositivo móvel, tudo sem a necessidade de executar software de emulação em infraestrutura baseada em CPU x86.

Inferência econômica de aprendizado de máquina baseada em GPU

Além de jogos para dispositivos móveis, os clientes que executam modelos de aprendizado de máquina em produção estão continuamente procurando maneiras de reduzir custos, pois a inferência de ML pode representar até 90% do gasto geral com infraestrutura para executar esses aplicativos em escala. Com esta nova oferta, os clientes poderão aproveitar os benefícios de preço / desempenho do Graviton2 para implantar modelos de aprendizado profundo acelerado por GPU a um custo significativamente menor em comparação com instâncias baseadas em x86 com aceleração de GPU.

AWS e NVIDIA: uma longa história de colaboração

AWS e NVIDIA têm colaborado por mais de 10 anos para fornecer continuamente soluções baseadas em GPU poderosas, econômicas e flexíveis para clientes, incluindo as mais recentes Instâncias EC2 G4 com GPUs NVIDIA T4 lançadas em 2019 e Instâncias EC2 P4d com GPUs NVIDIA A100 lançadas em 2020. As instâncias EC2 P4d são implantadas em clusters de hiperescala chamados EC2 UltraClusters que são compostos de computação, rede e armazenamento de maior desempenho na nuvem. EC2 UltraClusters suporta rede de instância de 400 Gbps, Elastic Fabric Adapter (EFA) e tecnologia NVIDIA GPUDirect RDMA para ajudar a treinar rapidamente modelos de ML usando técnicas distribuídas e escalonadas.

Além de ser o primeiro na nuvem a oferecer instâncias aceleradas de GPU e o primeiro na nuvem a oferecer GPUs NVIDIA V100, agora estamos trabalhando em conjunto com a NVIDIA para oferecer novas instâncias EC2 que combinam um processador baseado em Arm com um acelerador de GPU no segundo semestre de 2021. Para saber mais sobre como a AWS e a NVIDIA trabalham juntas para levar tecnologia inovadora aos clientes, visite AWS em NVIDIA GTC 21.


Sobre o autor

Geoff Murase é gerente sênior de marketing de produto das instâncias de computação acelerada do AWS EC2, ajudando os clientes a atender às suas necessidades de computação, fornecendo acesso a aceleradores de computação baseados em hardware, como unidades de processamento gráfico (GPUs) ou matrizes de portas programáveis ​​em campo (FPGAs). Nas horas vagas, ele gosta de jogar basquete e andar de bicicleta com sua família.

Fonte: https://aws.amazon.com/blogs/machine-learning/aws-and-nvidia-to-bring-arm-based-instances-with-gpus-to-the-cloud/

Carimbo de hora:

Mais de Blog do AWS Machine Learning