AWSとNVIDIAがGPUを搭載したArmベースのGraviton2インスタンスをクラウドに導入

ソースノード: 807655

AWSは、お客様に代わって革新を続けています。 私たちはNVIDIAと協力して、ArmプロセッサベースのNVIDIAGPUを高速化しています アマゾン エラスティック コンピューティング クラウド (Amazon EC2)2021年後半のクラウドへのインスタンス。このインスタンスはArmベースの機能を備えています AWSGraviton2プロセッサは、AW​​Sによってゼロから構築され、お客様がクラウドでワークロードを実行する方法に合わせて最適化されているため、汎用プロセッサに組み込まれる可能性のある多くの不要なコンポーネントが排除されます。

Graviton2プロセッサによるAWSのイノベーション

AWSは、お客様のためにクラウドコンピューティングのパイオニアを続けてきました。 2018年、AWSは、AWSGravitonプロセッサを搭載したEC2A1インスタンスを備えたArmベースのインスタンスをクラウドに提供した最初の主要なクラウドプロバイダーでした。 これらのインスタンスはArmコアを中心に構築されており、AWSのカスタムビルドシリコンを多用しています。 これらは、小さなインスタンスのグループ間で負荷を共有できるスケールアウトワークロードに最適です。

2020年に、AWSはAWSが設計したArmベースのGraviton2プロセッサをリリースし、第2世代のAWSGravitonプロセッサよりもパフォーマンスと機能が大幅に向上しました。 これらのプロセッサは、EC6汎用(M6g、M4gd、T6g)、コンピューティング最適化(C6g、C6gd、C6gn)、およびメモリ最適化(R6g、R2gd、X40gd)インスタンスに電力を供給し、同等の電流よりも最大86%優れた価格パフォーマンスを提供しますさまざまなワークロード用の世代x2ベースのインスタンス。 AWS GravitonXNUMXプロセッサは、第XNUMX世代のAWS GravitonプロセッサのXNUMX倍のパフォーマンス、XNUMX倍のコンピューティングコア、XNUMX倍の高速メモリ、XNUMX倍のキャッシュを提供します。

Domo、Formula One、Honeycomb.io、Intuit、LexisNexis Risk Solutions、Nielsen、NextRoll、Redbox、SmugMug、Snap、Twitterなどのお客様は、AWSGraviton2ベースのインスタンスを本番環境で実行することでパフォーマンスが大幅に向上しコストが削減されています。 2ビットのArmアーキテクチャに基づくAWSGraviton64プロセッサは、Amazon Linux 2、Red Hat、SUSE、Ubuntuなどの一般的なLinuxオペレーティングシステムでサポートされています。 AWSおよびISVの多くの一般的なアプリケーションとサービスも、AWSGraviton2ベースのインスタンスをサポートしています。 Arm開発者は、これらのインスタンスを使用してクラウドでネイティブにアプリケーションを構築できるため、エラーが発生しやすく時間のかかるエミュレーションやクロスコンパイルの必要がなくなります。 NVIDIA GPUを追加すると、ゲームや機械学習(ML)推論などの他のArmベースのワークロードを含む、さまざまなクラウドワークロードのGraviton2ベースのインスタンスが高速化されます。

Androidゲームをクラウドに簡単に移動

による AppAnnieからの調査、モバイルゲームは現在最も人気のあるゲーム形式であり、コンソール、PC、およびMacを追い抜いています。 追加 AppAnnieからの調査 は、モバイルデバイスに費やされる時間の最大10%がゲームに費やされていることを示しており、ゲーム開発者は、現在および将来使用されるさまざまなモバイルデバイスのセットに合わせてゲームをサポートおよび最適化する必要があります。 クラウドを活用することで、ゲーム開発者はモバイルデバイスのスペクトル全体で均一なエクスペリエンスを提供し、モバイルデバイスのコンピューティングと電力の需要が少ないため、バッテリーの寿命を延ばすことができます。 NVIDIAGPUアクセラレーションを備えたAWSGraviton2インスタンスにより、ゲーム開発者はAndroidゲームをネイティブに実行し、レンダリングされたグラフィックをエンコードし、ネットワーク経由でモバイルデバイスにゲームをストリーミングできます。すべて、x86CPUベースのインフラストラクチャでエミュレーションソフトウェアを実行する必要はありません。

費用対効果の高いGPUベースの機械学習推論

モバイルゲームに加えて、本番環境で機械学習モデルを実行している顧客は、ML推論がこれらのアプリケーションを大規模に実行するためのインフラストラクチャ全体の支出の最大90%を占める可能性があるため、コストを削減する方法を継続的に探しています。 この新しいオファリングにより、お客様はGraviton2の価格/パフォーマンスの利点を活用して、GPUアクセラレーションを備えたx86ベースのインスタンスと比較して大幅に低いコストでGPUアクセラレーションディープラーニングモデルをデプロイできるようになります。

AWSとNVIDIA:コラボレーションの長い歴史

AWSとNVIDIAは、10年以上にわたって協力して、強力で費用効果が高く、柔軟なGPUベースのソリューションを最新のものを含む顧客に継続的に提供してきました。 EC2G4インスタンス 4年に発売されたNVIDIAT2019GPUと EC2P4dインスタンス EC100 P2020dインスタンスは、クラウドで最高のパフォーマンスのコンピューティング、ネットワーキング、ストレージで構成されるEC2UltraClustersと呼ばれるハイパースケールクラスターにデプロイされます。 EC4 UltraClustersは、2 Gbpsインスタンスネットワーキング、Elastic Fabric Adapter(EFA)、およびNVIDIA GPUDirect RDMAテクノロジーをサポートし、スケールアウトおよび分散技術を使用してMLモデルを迅速にトレーニングするのに役立ちます。

クラウドで最初にGPUアクセラレーションインスタンスを提供し、クラウドで最初にNVIDIA V100 GPUを提供することに加えて、現在NVIDIAと協力して、ArmベースのプロセッサとGPUアクセラレータを組み合わせた新しいEC2インスタンスを提供しています。 2021年の後半。AWSとNVIDIAがどのように連携して革新的なテクノロジーを顧客に提供するかについて詳しくは、次のWebサイトをご覧ください。 NVIDIA GTC21でのAWS.


著者について

村瀬ジェフ AWS EC2アクセラレートコンピューティングインスタンスのシニアプロダクトマーケティングマネージャーで、グラフィックスプロセッシングユニット(GPU)やフィールドプログラマブルゲートアレイ(FPGA)などのハードウェアベースのコンピューティングアクセラレーターへのアクセスを提供することで、お客様がコンピューティングニーズを満たすのを支援します。 余暇には家族と一緒にバスケットボールやサイクリングを楽​​しんでいます。

ソース:https://aws.amazon.com/blogs/machine-learning/aws-and-nvidia-to-bring-arm-based-instances-with-gpus-to-the-cloud/

タイムスタンプ:

より多くの AWS機械学習ブログ