AWS và NVIDIA đưa các phiên bản Graviton2 dựa trên Arm với GPU lên đám mây

Nút nguồn: 807655

AWS tiếp tục đổi mới thay mặt cho khách hàng của chúng tôi. Chúng tôi đang làm việc với NVIDIA để mang lại một bộ xử lý dựa trên Arm, GPU NVIDIA được tăng tốc Đám mây điện toán đàn hồi Amazon (Amazon EC2) phiên bản cho đám mây vào nửa cuối năm 2021. Phiên bản này sẽ có tính năng dựa trên Cánh tay Bộ xử lý AWS Graviton2, được AWS xây dựng từ đầu và được tối ưu hóa cho cách khách hàng chạy khối lượng công việc của họ trên đám mây, loại bỏ nhiều thành phần không cần thiết có thể đi vào bộ xử lý đa năng.

Cải tiến AWS với bộ xử lý Graviton2

AWS đã tiếp tục đi tiên phong trong lĩnh vực điện toán đám mây cho khách hàng của chúng tôi. Vào năm 2018, AWS là nhà cung cấp đám mây lớn đầu tiên cung cấp các phiên bản dựa trên Arm trên đám mây với các phiên bản EC2 A1 được cung cấp bởi bộ xử lý AWS Graviton. Các phiên bản này được xây dựng xung quanh lõi Arm và sử dụng rộng rãi silicon được chế tạo tùy chỉnh của AWS. Chúng rất phù hợp cho các khối lượng công việc mở rộng, trong đó bạn có thể chia sẻ tải trên một nhóm các phiên bản nhỏ hơn.

Vào năm 2020, AWS đã phát hành bộ xử lý Graviton2 dựa trên Arm do AWS thiết kế, mang lại bước nhảy vọt về hiệu suất và khả năng so với bộ xử lý AWS Graviton thế hệ đầu tiên. Các bộ vi xử lý này cung cấp năng lượng cho các phiên bản EC2 chung (M6g, M6gd, T4g), tối ưu hóa cho máy tính (C6g, C6gd, C6gn) và tối ưu hóa bộ nhớ (R6g, R6gd, X2gd) và cung cấp hiệu suất giá tốt hơn tới 40% so với dòng điện so sánh phiên bản dựa trên x86 thế hệ cho nhiều khối lượng công việc. Bộ xử lý AWS Graviton2 mang lại hiệu suất cao hơn bảy lần, số lõi tính toán nhiều hơn bốn lần, bộ nhớ nhanh hơn năm lần và bộ nhớ đệm lớn gấp đôi so với bộ xử lý AWS Graviton thế hệ đầu tiên.

Các khách hàng bao gồm Domo, Formula One, Honeycomb.io, Intuit, LexisNexis Risk Solutions, Nielsen, NextRoll, Redbox, SmugMug, Snap và Twitter đã thấy hiệu suất tăng đáng kể và giảm chi phí từ việc chạy các phiên bản dựa trên AWS Graviton2 trong sản xuất. Bộ xử lý AWS Graviton2, dựa trên kiến ​​trúc Arm 64-bit, được hỗ trợ bởi các hệ điều hành Linux phổ biến, bao gồm Amazon Linux 2, Red Hat, SUSE và Ubuntu. Nhiều ứng dụng và dịch vụ phổ biến từ AWS và ISV cũng hỗ trợ các phiên bản dựa trên AWS Graviton2. Các nhà phát triển cánh tay có thể sử dụng các phiên bản này để xây dựng các ứng dụng nguyên bản trên đám mây, do đó loại bỏ nhu cầu mô phỏng và biên dịch chéo, vốn dễ xảy ra lỗi và tốn thời gian. Việc thêm GPU NVIDIA sẽ tăng tốc các phiên bản dựa trên Graviton2 cho các khối lượng công việc đám mây đa dạng, bao gồm cả trò chơi và các khối lượng công việc dựa trên Arm khác như suy luận máy học (ML).

Dễ dàng di chuyển các trò chơi Android lên đám mây

Theo nghiên cứu từ App Annie, chơi game trên thiết bị di động hiện là hình thức chơi game phổ biến nhất và đã vượt qua console, PC và Mac. Thêm vào nghiên cứu từ App Annie đã chỉ ra rằng có tới 10% thời gian dành cho thiết bị di động là dành cho trò chơi và các nhà phát triển trò chơi cần hỗ trợ và tối ưu hóa trò chơi của họ cho nhiều loại thiết bị di động đang được sử dụng hiện nay và trong tương lai. Bằng cách tận dụng đám mây, các nhà phát triển trò chơi có thể cung cấp trải nghiệm đồng nhất trên nhiều thiết bị di động và kéo dài tuổi thọ pin do nhu cầu điện toán và điện năng trên thiết bị di động thấp hơn. Phiên bản AWS Graviton2 với khả năng tăng tốc GPU NVIDIA cho phép các nhà phát triển trò chơi chạy các trò chơi Android nguyên bản, mã hóa đồ họa được kết xuất và truyền trực tuyến trò chơi qua mạng tới thiết bị di động mà không cần chạy phần mềm giả lập trên cơ sở hạ tầng dựa trên CPU x86.

Suy luận máy học dựa trên GPU, tiết kiệm chi phí

Ngoài việc chơi game trên thiết bị di động, khách hàng đang chạy các mô hình máy học trong quá trình sản xuất liên tục tìm cách để giảm chi phí vì suy luận ML có thể chiếm tới 90% tổng chi phí cơ sở hạ tầng để chạy các ứng dụng này trên quy mô lớn. Với ưu đãi mới này, khách hàng sẽ có thể tận dụng các lợi ích về giá / hiệu suất của Graviton2 để triển khai các mô hình học sâu tăng tốc GPU với chi phí thấp hơn đáng kể so với các phiên bản dựa trên x86 có tăng tốc GPU.

AWS và NVIDIA: Lịch sử hợp tác lâu dài

AWS và NVIDIA đã hợp tác trong hơn 10 năm để liên tục cung cấp các giải pháp dựa trên GPU mạnh mẽ, hiệu quả về chi phí và linh hoạt cho khách hàng, bao gồm cả những giải pháp mới nhất Phiên bản EC2 G4 với GPU NVIDIA T4 ra mắt vào năm 2019 và Phiên bản EC2 P4d với GPU NVIDIA A100 ra mắt vào năm 2020. Các phiên bản EC2 P4d được triển khai trong các cụm siêu tỷ lệ được gọi là EC2 UltraClusters bao gồm tính toán, mạng và lưu trữ hiệu suất cao nhất trên đám mây. EC2 UltraClusters hỗ trợ mạng phiên bản 400 Gbps, Bộ điều hợp vải đàn hồi (EFA) và công nghệ NVIDIA GPUDirect RDMA để giúp đào tạo nhanh chóng các mô hình ML bằng cách sử dụng các kỹ thuật mở rộng và phân tán.

Ngoài việc là người đầu tiên trên đám mây cung cấp các phiên bản tăng tốc GPU và lần đầu tiên trên đám mây cung cấp GPU NVIDIA V100, chúng tôi hiện đang làm việc cùng với NVIDIA để cung cấp các phiên bản EC2 mới kết hợp bộ xử lý dựa trên Arm với bộ tăng tốc GPU trong nửa cuối năm 2021. Để tìm hiểu thêm về cách AWS và NVIDIA hợp tác với nhau để mang lại công nghệ tiên tiến cho khách hàng, hãy truy cập AWS tại NVIDIA GTC 21.


Lưu ý

Geoff Murase là Giám đốc Tiếp thị Sản phẩm Cấp cao cho các phiên bản máy tính tăng tốc AWS EC2, giúp khách hàng đáp ứng nhu cầu tính toán của họ bằng cách cung cấp quyền truy cập vào các bộ tăng tốc máy tính dựa trên phần cứng như Đơn vị xử lý đồ họa (GPU) hoặc Mảng cổng lập trình trường (FPGA). Khi rảnh rỗi, anh ấy thích chơi bóng rổ và đi xe đạp với gia đình.

Nguồn: https://aws.amazon.com/blogs/machine-learning/aws-and-nvidia-to-bring-arm-based-instances-with-gpus-to-the-cloud/

Dấu thời gian:

Thêm từ Blog Học máy AWS