Представляємо три нові екземпляри Amazon EC2 на базі NVIDIA GPU | Веб-сервіси Amazon

Представляємо три нові екземпляри Amazon EC2 на базі NVIDIA GPU | Веб-сервіси Amazon

Вихідний вузол: 2402117

Обчислювальна хмара Amazon Elastic Портфоліо прискорених обчислень (Amazon EC2) пропонує найширший вибір прискорювачів для роботи у сфері штучного інтелекту (AI), машинного навчання (ML), графіки та високопродуктивних обчислень (HPC). Ми раді оголосити про розширення цього портфоліо трьома новими примірниками з найновішими графічними процесорами NVIDIA: примірниками Amazon EC2 P5e на базі графічних процесорів NVIDIA H200, примірниками Amazon EC2 G6 із графічними процесорами NVIDIA L4 та примірниками Amazon EC2 G6e на основі графічних процесорів NVIDIA L40S. Усі три екземпляри будуть доступні у 2024 році, і ми з нетерпінням чекаємо, що ви зможете з ними зробити.

AWS і NVIDIA співпрацюють понад 13 років і стали піонерами в розробці широкомасштабних, високопродуктивних і економічно ефективних рішень на основі GPU для розробників і підприємств у всьому спектрі. Ми поєднали потужні графічні процесори NVIDIA з диференційованими технологіями AWS, такими як Система AWS Nitro, 3,200 Гбіт/с Адаптер з еластичної тканини (EFA) v2 мережі, сотні ГБ/с пропускної здатності даних з Amazon FSx для Luster, а також обчислення в екзамасштабі за допомогою Amazon EC2 UltraClusters для забезпечення найпродуктивнішої інфраструктури для AI/ML, графіки та HPC. У поєднанні з іншими керованими службами, такими як Amazon Bedrock, Amazon SageMaker та Послуга Amazon Elastic Kubernetes (Amazon EKS), ці екземпляри надають розробникам найкращу в галузі платформу для створення та розгортання генеративних AI, HPC і графічних програм.

Високопродуктивні та економічно ефективні екземпляри на базі GPU для AI, HPC і графічних навантажень

Для розробки, навчання та висновків найбільших великих мовних моделей (LLM) екземпляри EC2 P5e будуть оснащені новітніми графічними процесорами NVIDIA H200, які пропонують 141 ГБ пам’яті GPU HBM3e, що в 1.7 рази більше та в 1.4 рази швидше, ніж графічні процесори H100. . Цей приріст пам’яті графічного процесора разом із мережею EFA зі швидкістю до 3200 Гбіт/с за допомогою AWS Nitro System дозволить вам продовжувати створювати, навчати та розгортати свої передові моделі на AWS.

Екземпляри EC2 G6e із графічними процесорами NVIDIA L40S створені, щоб надати розробникам широкодоступну опцію для навчання та визначення загальнодоступних LLM, а також підтримувати все більш широке впровадження малих мовних моделей (SLM). Вони також оптимальні для цифрових подвійних програм, які використовують NVIDIA Omniverse для опису та моделювання 3D-інструментів і програм, а також для створення віртуальних світів і розширених робочих процесів для промислової цифровізації.

Екземпляри EC2 G6 із графічним процесором NVIDIA L4 нададуть дешевше й енергоефективне рішення для розгортання моделей ML для обробки природної мови, перекладу мови, аналізу відео та зображень, розпізнавання мовлення та персоналізації, а також графічних робочих навантажень, таких як створення та рендеринг графіки кінематографічної якості в реальному часі та потокове передавання ігор.


Про автора

Четан Капур є директором з управління продуктами портфоліо прискорених обчислень Amazon EC2.

Часова мітка:

Більше від AWS Машинне навчання