AWS y NVIDIA llevarán instancias Graviton2 basadas en Arm con GPU a la nube

Reeditado por Platón

seguidores: 0

AWS continúa innovando en nombre de nuestros clientes. Estamos trabajando con NVIDIA para ofrecer un procesador Arm acelerado por GPU NVIDIA Nube informática elástica de Amazon (Amazon EC2) a la nube en la segunda mitad de 2021. Esta instancia contará con la instancia Arm-based Procesador AWS Graviton2, que fue creado desde cero por AWS y optimizado para la forma en que los clientes ejecutan sus cargas de trabajo en la nube, eliminando una gran cantidad de componentes innecesarios que de otra manera podrían ir a un procesador de uso general.

Innovación de AWS con procesadores Graviton2

AWS ha seguido siendo pionera en la computación en la nube para nuestros clientes. En 2018, AWS fue el primer proveedor de nube importante en ofrecer instancias basadas en Arm en la nube con instancias EC2 A1 impulsadas por procesadores AWS Graviton. Estas instancias se crean alrededor de Arm cores y hacen un uso extensivo del silicio personalizado de AWS. Son ideales para cargas de trabajo de escalamiento horizontal en las que puede compartir la carga en un grupo de instancias más pequeñas.

En 2020, AWS lanzó procesadores Graviton2 basados en Arm y diseñados por AWS, lo que supuso un gran salto en rendimiento y capacidades con respecto a los procesadores AWS Graviton de primera generación. Estos procesadores alimentan instancias EC2 de propósito general (M6g, M6gd, T4g), optimizadas para computación (C6g, C6gd, C6gn) y optimizadas para memoria (R6g, R6gd, X2gd), y brindan hasta un 40% más de rendimiento de precios en comparación con la corriente comparable instancias basadas en x86 de generación para una amplia variedad de cargas de trabajo. Los procesadores AWS Graviton2 ofrecen siete veces más rendimiento, cuatro veces más núcleos de cómputo, memoria cinco veces más rápida y cachés dos veces más grandes que los procesadores AWS Graviton de primera generación.

Clientes como Domo, Fórmula Uno, Honeycomb.io, Intuit, LexisNexis Risk Solutions, Nielsen, NextRoll, Redbox, SmugMug, Snap y Twitter han visto ganancias de rendimiento significativas y costos reducidos al ejecutar instancias basadas en AWS Graviton2 en producción. Los procesadores AWS Graviton2, basados en la arquitectura Arm de 64 bits, son compatibles con los sistemas operativos Linux populares, incluidos Amazon Linux 2, Red Hat, SUSE y Ubuntu. Muchas aplicaciones y servicios populares de AWS e ISV también admiten instancias basadas en AWS Graviton2. Los desarrolladores de Arm pueden utilizar estas instancias para crear aplicaciones de forma nativa en la nube, eliminando así la necesidad de emulación y compilación cruzada, que son propensas a errores y requieren mucho tiempo. Agregar GPU NVIDIA acelera las instancias basadas en Graviton2 para diversas cargas de trabajo en la nube, incluidos juegos y otras cargas de trabajo basadas en Arm, como la inferencia de aprendizaje automático (ML).

Mueva fácilmente juegos de Android a la nube

Según la investigación de la aplicación Annie, los juegos móviles son ahora la forma más popular de juegos y han superado a las consolas, PC y Mac. Adicional investigación de la aplicación Annie ha demostrado que hasta el 10% de todo el tiempo dedicado a los dispositivos móviles se dedica a los juegos, y los desarrolladores de juegos deben respaldar y optimizar sus juegos para el diverso conjunto de dispositivos móviles que se utilizan hoy y en el futuro. Al aprovechar la nube, los desarrolladores de juegos pueden brindar una experiencia uniforme en todo el espectro de dispositivos móviles y extender la vida útil de la batería debido a las menores demandas de computación y energía en el dispositivo móvil. La instancia de AWS Graviton2 con aceleración de GPU NVIDIA permite a los desarrolladores de juegos ejecutar juegos de Android de forma nativa, codificar los gráficos renderizados y transmitir el juego a través de redes a un dispositivo móvil, todo sin necesidad de ejecutar software de emulación en una infraestructura basada en CPU x86.

Inferencia de aprendizaje automático rentable basada en GPU

Además de los juegos móviles, los clientes que ejecutan modelos de aprendizaje automático en producción buscan continuamente formas de reducir los costos, ya que la inferencia de ML puede representar hasta el 90% del gasto general en infraestructura para ejecutar estas aplicaciones a escala. Con esta nueva oferta, los clientes podrán aprovechar los beneficios de precio / rendimiento de Graviton2 para implementar modelos de aprendizaje profundo acelerados por GPU a un costo significativamente menor en comparación con las instancias basadas en x86 con aceleración de GPU.

AWS y NVIDIA: una larga historia de colaboración

AWS y NVIDIA han colaborado durante más de 10 años para ofrecer continuamente soluciones potentes, rentables y flexibles basadas en GPU a los clientes, incluida la última Instancias EC2 G4 con las GPU NVIDIA T4 lanzadas en 2019 y Instancias EC2 P4d con las GPU NVIDIA A100 lanzadas en 2020. Las instancias EC2 P4d se implementan en clústeres de hiperescala denominados EC2 UltraClusters que se componen de la computación, las redes y el almacenamiento de mayor rendimiento en la nube. Los EC2 UltraClusters admiten redes de instancias de 400 Gbps, Elastic Fabric Adapter (EFA) y tecnología NVIDIA GPUDirect RDMA para ayudar a entrenar rápidamente modelos de ML mediante técnicas de escalamiento horizontal y distribuidas.

Además de ser los primeros en la nube en ofrecer instancias aceleradas por GPU y los primeros en la nube en ofrecer GPU NVIDIA V100, ahora estamos trabajando junto con NVIDIA para ofrecer nuevas instancias EC2 que combinan un procesador basado en Arm con un acelerador de GPU en el segunda mitad de 2021. Para obtener más información sobre cómo AWS y NVIDIA trabajan juntos para llevar tecnología innovadora a los clientes, visite AWS en NVIDIA GTC 21.

Sobre la autora

Geoff Murase es un Gerente Senior de Mercadeo de Productos para instancias de computación acelerada AWS EC2, ayudando a los clientes a satisfacer sus necesidades de computación al proporcionar acceso a aceleradores de computación basados en hardware tales como Unidades de Procesamiento de Gráficos (GPU) o Matrices de Puertas Programables en Campo (FPGA). En su tiempo libre, disfruta jugar baloncesto y andar en bicicleta con su familia.