AWS와 NVIDIA, GPU가있는 Arm 기반 Graviton2 인스턴스를 클라우드로 가져옴

소스 노드 : 807655

AWS는 고객을 대신하여 계속 혁신하고 있습니다. NVIDIA와 협력하여 Arm 프로세서 기반의 NVIDIA GPU 가속화 아마존 엘라스틱 컴퓨트 클라우드 (Amazon EC2) 인스턴스를 2021 년 하반기에 클라우드로 전환합니다.이 인스턴스는 Arm 기반 AWS Graviton2 프로세서는 AWS에 의해 처음부터 구축되었으며 고객이 클라우드에서 워크로드를 실행하는 방법에 최적화되어 범용 프로세서에 들어갈 수있는 불필요한 많은 구성 요소를 제거합니다.

Graviton2 프로세서를 사용한 AWS 혁신

AWS는 고객을위한 클라우드 컴퓨팅을 지속적으로 개척해 왔습니다. 2018 년에 AWS는 AWS Graviton 프로세서로 구동되는 EC2 A1 인스턴스를 사용하여 클라우드에서 Arm 기반 인스턴스를 제공 한 최초의 주요 클라우드 제공 업체였습니다. 이러한 인스턴스는 Arm 코어를 중심으로 구축되며 AWS 맞춤형 실리콘을 광범위하게 사용합니다. 소규모 인스턴스 그룹에서로드를 공유 할 수있는 확장 워크로드에 매우 적합합니다.

2020 년에 AWS는 AWS에서 설계 한 Arm 기반 Graviton2 프로세서를 출시하여 2 세대 AWS Graviton 프로세서에 비해 성능과 기능이 크게 향상되었습니다. 이러한 프로세서는 EC6 범용 (M6g, M4gd, T6g), 컴퓨팅 최적화 (C6g, C6gd, C6gn) 및 메모리 최적화 (R6g, R2gd, X40gd) 인스턴스를 지원하며 비슷한 전류 대비 최대 86 % 더 나은 가격 성능을 제공합니다. 다양한 워크로드를위한 세대 x2 기반 인스턴스. AWS GravitonXNUMX 프로세서는 XNUMX 세대 AWS Graviton 프로세서에 비해 XNUMX 배 더 많은 성능, XNUMX 배 더 많은 컴퓨팅 코어, XNUMX 배 더 빠른 메모리 및 XNUMX 배 더 큰 캐시를 제공합니다.

Domo, Formula One, Honeycomb.io, Intuit, LexisNexis Risk Solutions, Nielsen, NextRoll, Redbox, SmugMug, Snap 및 Twitter를 포함한 고객은 프로덕션에서 AWS Graviton2 기반 인스턴스를 실행하여 상당한 성능 향상과 비용 절감을 경험했습니다. 2 비트 Arm 아키텍처를 기반으로하는 AWS Graviton64 프로세서는 Amazon Linux 2, Red Hat, SUSE 및 Ubuntu를 비롯한 널리 사용되는 Linux 운영 체제에서 지원됩니다. AWS 및 ISV의 많은 인기 애플리케이션과 서비스는 AWS Graviton2 기반 인스턴스도 지원합니다. Arm 개발자는 이러한 인스턴스를 사용하여 클라우드에서 기본적으로 애플리케이션을 빌드 할 수 있으므로 오류가 발생하기 쉽고 시간이 많이 소요되는 에뮬레이션 및 교차 컴파일이 필요하지 않습니다. NVIDIA GPU를 추가하면 게임 및 기계 학습 (ML) 추론과 같은 기타 Arm 기반 워크로드를 포함한 다양한 클라우드 워크로드를위한 Graviton2 기반 인스턴스가 가속화됩니다.

Android 게임을 클라우드로 쉽게 이동

에 따르면 App Annie의 연구, 모바일 게임은 이제 가장 인기있는 게임 형식이며 콘솔, PC 및 Mac을 추월했습니다. 추가 App Annie의 연구 모바일 장치에서 보내는 모든 시간의 최대 10 %가 게임이며 게임 개발자는 현재와 미래에 사용되는 다양한 모바일 장치 세트에 맞게 게임을 지원하고 최적화해야합니다. 클라우드를 활용하여 게임 개발자는 다양한 모바일 장치에서 일관된 경험을 제공하고 모바일 장치의 낮은 컴퓨팅 및 전력 수요로 인해 배터리 수명을 연장 할 수 있습니다. NVIDIA GPU 가속 기능이있는 AWS Graviton2 인스턴스를 사용하면 게임 개발자가 x86 CPU 기반 인프라에서 에뮬레이션 소프트웨어를 실행할 필요없이 기본적으로 Android 게임을 실행하고, 렌더링 된 그래픽을 인코딩하고, 네트워크를 통해 모바일 장치로 게임을 스트리밍 할 수 있습니다.

비용 효율적인 GPU 기반 기계 학습 추론

모바일 게임 외에도 머신 러닝 모델을 프로덕션 환경에서 실행하는 고객은 ML 추론이 이러한 애플리케이션을 대규모로 실행하는 데 필요한 전체 인프라 지출의 최대 90 %를 차지할 수 있으므로 비용을 절감 할 방법을 지속적으로 찾고 있습니다. 이 새로운 오퍼링을 통해 고객은 Graviton2의 가격 / 성능 이점을 활용하여 GPU 가속화를 사용하는 x86 기반 인스턴스에 비해 훨씬 저렴한 비용으로 GPU 가속화 딥 러닝 모델을 배포 할 수 있습니다.

AWS와 NVIDIA : 오랜 협력의 역사

AWS와 NVIDIA는 10 년 넘게 협력하여 강력하고 비용 효율적이며 유연한 GPU 기반 솔루션을 최신 제품을 포함한 고객에게 지속적으로 제공하고 있습니다. EC2 G4 인스턴스 4 년에 출시 된 NVIDIA T2019 GPU와 EC2 P4d 인스턴스 100 년에 출시 된 NVIDIA A2020 GPU. EC2 P4d 인스턴스는 클라우드에서 최고 성능의 컴퓨팅, 네트워킹 및 스토리지로 구성된 EC2 UltraClusters라는 하이퍼 스케일 클러스터에 배포됩니다. EC2 UltraClusters는 400Gbps 인스턴스 네트워킹, EFA (Elastic Fabric Adapter) 및 NVIDIA GPUDirect RDMA 기술을 지원하여 수평 확장 및 분산 기술을 사용하여 ML 모델을 빠르게 교육 할 수 있습니다.

클라우드에서 처음으로 GPU 가속 인스턴스를 제공하고 클라우드에서 처음으로 NVIDIA V100 GPU를 제공하는 것 외에도, 이제 NVIDIA와 협력하여 Arm 기반 프로세서와 GPU 가속기를 결합한 새로운 EC2 인스턴스를 제공하고 있습니다. 2021 년 하반기. AWS와 NVIDIA가 협력하여 고객에게 혁신적인 기술을 제공하는 방법에 대해 자세히 알아 보려면 NVIDIA GTC 21의 AWS.


저자에 관하여

제프 무라 세 AWS EC2 가속 컴퓨팅 인스턴스의 선임 제품 마케팅 관리자로 GPU (Graphics Processing Unit) 또는 FPGA (Field Programmable Gate Array)와 같은 하드웨어 기반 컴퓨팅 가속기에 대한 액세스를 제공함으로써 고객이 컴퓨팅 요구를 충족 할 수 있도록 도와줍니다. 여가 시간에는 농구를하고 가족과 자전거 타기를 즐깁니다.

출처 : https://aws.amazon.com/blogs/machine-learning/aws-and-nvidia-to-bring-arm-based-instances-with-gpus-to-the-cloud/

타임 스탬프 :

더보기 AWS 머신 러닝 블로그