Обчислювальна хмара Amazon Elastic Портфоліо прискорених обчислень (Amazon EC2) пропонує найширший вибір прискорювачів для роботи у сфері штучного інтелекту (AI), машинного навчання (ML), графіки та високопродуктивних обчислень (HPC). Ми раді оголосити про розширення цього портфоліо трьома новими примірниками з найновішими графічними процесорами NVIDIA: примірниками Amazon EC2 P5e на базі графічних процесорів NVIDIA H200, примірниками Amazon EC2 G6 із графічними процесорами NVIDIA L4 та примірниками Amazon EC2 G6e на основі графічних процесорів NVIDIA L40S. Усі три екземпляри будуть доступні у 2024 році, і ми з нетерпінням чекаємо, що ви зможете з ними зробити.
AWS і NVIDIA співпрацюють понад 13 років і стали піонерами в розробці широкомасштабних, високопродуктивних і економічно ефективних рішень на основі GPU для розробників і підприємств у всьому спектрі. Ми поєднали потужні графічні процесори NVIDIA з диференційованими технологіями AWS, такими як Система AWS Nitro, 3,200 Гбіт/с Адаптер з еластичної тканини (EFA) v2 мережі, сотні ГБ/с пропускної здатності даних з Amazon FSx для Luster, а також обчислення в екзамасштабі за допомогою Amazon EC2 UltraClusters для забезпечення найпродуктивнішої інфраструктури для AI/ML, графіки та HPC. У поєднанні з іншими керованими службами, такими як Amazon Bedrock, Amazon SageMaker та Послуга Amazon Elastic Kubernetes (Amazon EKS), ці екземпляри надають розробникам найкращу в галузі платформу для створення та розгортання генеративних AI, HPC і графічних програм.
Високопродуктивні та економічно ефективні екземпляри на базі GPU для AI, HPC і графічних навантажень
Для розробки, навчання та висновків найбільших великих мовних моделей (LLM) екземпляри EC2 P5e будуть оснащені новітніми графічними процесорами NVIDIA H200, які пропонують 141 ГБ пам’яті GPU HBM3e, що в 1.7 рази більше та в 1.4 рази швидше, ніж графічні процесори H100. . Цей приріст пам’яті графічного процесора разом із мережею EFA зі швидкістю до 3200 Гбіт/с за допомогою AWS Nitro System дозволить вам продовжувати створювати, навчати та розгортати свої передові моделі на AWS.
Екземпляри EC2 G6e із графічними процесорами NVIDIA L40S створені, щоб надати розробникам широкодоступну опцію для навчання та визначення загальнодоступних LLM, а також підтримувати все більш широке впровадження малих мовних моделей (SLM). Вони також оптимальні для цифрових подвійних програм, які використовують NVIDIA Omniverse для опису та моделювання 3D-інструментів і програм, а також для створення віртуальних світів і розширених робочих процесів для промислової цифровізації.
Екземпляри EC2 G6 із графічним процесором NVIDIA L4 нададуть дешевше й енергоефективне рішення для розгортання моделей ML для обробки природної мови, перекладу мови, аналізу відео та зображень, розпізнавання мовлення та персоналізації, а також графічних робочих навантажень, таких як створення та рендеринг графіки кінематографічної якості в реальному часі та потокове передавання ігор.
Про автора
Четан Капур є директором з управління продуктами портфоліо прискорених обчислень Amazon EC2.
- Розповсюдження контенту та PR на основі SEO. Отримайте посилення сьогодні.
- PlatoData.Network Vertical Generative Ai. Додайте собі сили. Доступ тут.
- PlatoAiStream. Web3 Intelligence. Розширення знань. Доступ тут.
- ПлатонЕСГ. вуглець, CleanTech, Енергія, Навколишнє середовище, Сонячна, Поводження з відходами. Доступ тут.
- PlatoHealth. Розвідка про біотехнології та клінічні випробування. Доступ тут.
- джерело: https://aws.amazon.com/blogs/machine-learning/introducing-three-new-nvidia-gpu-based-amazon-ec2-instances/
- :є
- $UP
- 1
- 100
- 13
- 200
- 2024
- 3d
- 7
- a
- прискорений
- прискорювачі
- через
- Прийняття
- просунутий
- AI
- AI / ML
- ВСІ
- по
- Також
- Amazon
- Amazon EC2
- Amazon Web Services
- аналіз
- та
- Оголосити
- застосування
- ЕСТЬ
- штучний
- штучний інтелект
- Штучний інтелект (AI)
- AS
- доступний
- AWS
- BE
- КРАЩЕ
- підвищення
- широко
- будувати
- Створюємо
- побудований
- by
- CAN
- вибір
- співпрацював
- комбінований
- обчислення
- обчислення
- продовжувати
- рентабельним
- з'єднаний
- створення
- передовий
- дані
- доставляти
- розгортання
- розгортання
- описують
- розробників
- розробка
- диференційований
- цифровий
- цифровий близнюк
- цифровізація
- Директор
- do
- включіть
- включений
- підприємство
- Ефір (ETH)
- Exascale Computing
- збуджений
- розширення
- тканину
- швидше
- особливість
- Показуючи
- для
- Вперед
- гра
- генеративний
- Генеративний ШІ
- GPU
- Графічні процесори
- графіка
- Мати
- Високий
- Високопродуктивні обчислювальні системи
- дуже
- к.с.
- HTTP
- HTTPS
- Сотні
- зображення
- аналіз зображення
- in
- зростаючий
- промислові
- промисловості
- Інфраструктура
- випадки
- Інтелект
- введення
- JPG
- Кубернетес
- l4
- мова
- великий
- масштабний
- більше
- найбільших
- останній
- вивчення
- подивитися
- машина
- навчання за допомогою машини
- вдалося
- управління
- пам'ять
- ML
- Моделі
- найбільш
- Природний
- Природна мова
- Обробка природних мов
- мережа
- Нові
- Nitro
- Nvidia
- of
- пропонувати
- Пропозиції
- OmniVerse
- on
- оптимальний
- варіант
- Інше
- над
- продуктивність
- Втілення
- вперше
- платформа
- plato
- Інформація про дані Платона
- PlatoData
- портфель
- влада
- Харчування
- потужний
- обробка
- Product
- Управління продуктом
- забезпечувати
- публічно
- реального часу
- визнання
- надання
- бачачи
- Послуги
- невеликий
- рішення
- Рішення
- спектр
- мова
- Розпізнавання мови
- потоковий
- такі
- підтримка
- система
- Технології
- ніж
- Що
- Команда
- Їх
- Ці
- вони
- це
- три
- пропускна здатність
- times
- до
- інструменти
- поїзд
- Навчання
- Переклад
- twin
- використання
- Відео
- Віртуальний
- віртуальні світи
- we
- Web
- веб-сервіси
- ДОБРЕ
- Що
- який
- волі
- з
- Робочі процеси
- світі
- років
- ви
- вашу
- зефірнет