AWS และ NVIDIA นำอินสแตนซ์ Arm-based Graviton2 พร้อม GPU ไปยังคลาวด์

โหนดต้นทาง: 807655

AWS ยังคงสร้างสรรค์สิ่งใหม่ๆ ในนามของลูกค้าของเรา เรากำลังทำงานร่วมกับ NVIDIA เพื่อเร่งความเร็ว NVIDIA GPU ที่ใช้โปรเซสเซอร์แบบ Arm อเมซอน อีลาสติก คอมพิวท์ คลาวด์ (Amazon EC2) ไปยังคลาวด์ในช่วงครึ่งหลังของปี 2021 อินสแตนซ์นี้จะมีฟีเจอร์ Arm-based โปรเซสเซอร์ AWS Graviton2ซึ่งสร้างขึ้นจากพื้นฐานโดย AWS และปรับให้เหมาะสมสำหรับวิธีที่ลูกค้าเรียกใช้ปริมาณงานในระบบคลาวด์ โดยขจัดองค์ประกอบที่ไม่จำเป็นจำนวนมากที่อาจเข้าสู่ตัวประมวลผลทั่วไป

นวัตกรรม AWS ด้วยโปรเซสเซอร์ Graviton2

AWS ยังคงเป็นผู้บุกเบิกการประมวลผลแบบคลาวด์สำหรับลูกค้าของเราอย่างต่อเนื่อง ในปี 2018 AWS เป็นผู้ให้บริการระบบคลาวด์รายใหญ่รายแรกที่นำเสนออินสแตนซ์แบบ Arm ในระบบคลาวด์ด้วยอินสแตนซ์ EC2 A1 ที่ขับเคลื่อนโดยโปรเซสเซอร์ AWS Graviton อินสแตนซ์เหล่านี้สร้างขึ้นจากแกน Arm และใช้ประโยชน์จากซิลิคอนที่สร้างขึ้นเองของ AWS อย่างกว้างขวาง เหมาะอย่างยิ่งสำหรับการขยายขนาดงาน ซึ่งคุณสามารถแชร์ภาระงานในกลุ่มของอินสแตนซ์ที่มีขนาดเล็กกว่าได้

ในปี 2020 AWS ได้เปิดตัวโปรเซสเซอร์ Graviton2 แบบ Arm ที่ออกแบบโดย AWS ซึ่งมอบการก้าวกระโดดครั้งใหญ่ในด้านประสิทธิภาพและความสามารถเหนือโปรเซสเซอร์ AWS Graviton รุ่นแรก โปรเซสเซอร์เหล่านี้ขับเคลื่อนอินสแตนซ์สำหรับวัตถุประสงค์ทั่วไปของ EC2 (M6g, M6gd, T4g), เพิ่มประสิทธิภาพการประมวลผล (C6g, C6gd, C6gn) และหน่วยความจำที่ปรับให้เหมาะสม (R6g, R6gd, X2gd) และให้ราคาที่ดีกว่าถึง 40% เมื่อเทียบกับปัจจุบัน อินสแตนซ์ที่ใช้ x86 รุ่นสำหรับปริมาณงานที่หลากหลาย โปรเซสเซอร์ AWS Graviton2 ให้ประสิทธิภาพเพิ่มขึ้นเจ็ดเท่า คอร์ประมวลผลมากขึ้นสี่เท่า หน่วยความจำเร็วขึ้นห้าเท่า และแคชที่ใหญ่เป็นสองเท่าเมื่อเทียบกับโปรเซสเซอร์ AWS Graviton รุ่นแรก

ลูกค้าซึ่งรวมถึง Domo, Formula One, Honeycomb.io, Intuit, LexisNexis Risk Solutions, Nielsen, NextRoll, Redbox, SmugMug, Snap และ Twitter ได้เห็นประสิทธิภาพที่เพิ่มขึ้นอย่างมีนัยสำคัญและลดต้นทุนจากการเรียกใช้อินสแตนซ์ที่ใช้ AWS Graviton2 ในการผลิต โปรเซสเซอร์ AWS Graviton2 ซึ่งใช้สถาปัตยกรรม Arm 64 บิต ได้รับการสนับสนุนโดยระบบปฏิบัติการ Linux ยอดนิยม ซึ่งรวมถึง Amazon Linux 2, Red Hat, SUSE และ Ubuntu แอปพลิเคชันและบริการยอดนิยมมากมายจาก AWS และ ISV ยังรองรับอินสแตนซ์ที่ทำงานบน AWS Graviton2 ด้วย นักพัฒนา Arm สามารถใช้อินสแตนซ์เหล่านี้เพื่อสร้างแอปพลิเคชันแบบเนทีฟในระบบคลาวด์ ดังนั้นจึงขจัดความจำเป็นในการจำลองและการคอมไพล์ข้าม ซึ่งมักเกิดข้อผิดพลาดและใช้เวลานาน การเพิ่ม GPU ของ NVIDIA ช่วยเร่งความเร็วอินสแตนซ์ที่ใช้ Graviton2 สำหรับปริมาณงานบนคลาวด์ที่หลากหลาย รวมถึงการเล่นเกมและปริมาณงานแบบ Arm อื่นๆ เช่น การอนุมานการเรียนรู้ด้วยเครื่อง (ML)

ย้ายเกม Android ไปยังคลาวด์ได้อย่างง่ายดาย

ตามที่ งานวิจัยจาก App Annieปัจจุบันเกมบนมือถือเป็นรูปแบบเกมที่ได้รับความนิยมมากที่สุดและแซงหน้าคอนโซล พีซี และ Mac เพิ่มเติม งานวิจัยจาก App Annie ได้แสดงให้เห็นว่ามากถึง 10% ของเวลาทั้งหมดที่ใช้บนอุปกรณ์มือถือนั้นอยู่กับเกม และผู้พัฒนาเกมจำเป็นต้องสนับสนุนและเพิ่มประสิทธิภาพเกมของพวกเขาสำหรับชุดอุปกรณ์พกพาที่หลากหลายซึ่งใช้ในปัจจุบันและอนาคต ด้วยการใช้ประโยชน์จากระบบคลาวด์ นักพัฒนาเกมสามารถมอบประสบการณ์ที่เหมือนกันในทุกช่วงความถี่ของอุปกรณ์มือถือ และยืดอายุแบตเตอรี่เนื่องจากความต้องการด้านการประมวลผลและพลังงานที่ลดลงบนอุปกรณ์มือถือ อินสแตนซ์ AWS Graviton2 พร้อมการเร่งความเร็ว GPU ของ NVIDIA ช่วยให้นักพัฒนาเกมสามารถเรียกใช้เกม Android แบบเนทีฟ เข้ารหัสกราฟิกที่แสดงผล และสตรีมเกมผ่านเครือข่ายไปยังอุปกรณ์มือถือ ทั้งหมดนี้ไม่จำเป็นต้องเรียกใช้ซอฟต์แวร์จำลองบนโครงสร้างพื้นฐานที่ใช้ CPU x86

การอนุมานการเรียนรู้ของเครื่องที่ใช้ GPU ที่คุ้มค่า

นอกจากการเล่นเกมบนมือถือแล้ว ลูกค้าที่ใช้โมเดลการเรียนรู้ของเครื่องในการผลิตยังมองหาวิธีลดต้นทุนอย่างต่อเนื่อง เนื่องจากการอนุมาน ML สามารถแสดงถึงการใช้จ่ายโครงสร้างพื้นฐานโดยรวมได้ถึง 90% สำหรับการเรียกใช้แอปพลิเคชันเหล่านี้ตามขนาด ด้วยข้อเสนอใหม่นี้ ลูกค้าจะสามารถใช้ประโยชน์จากประโยชน์ด้านราคา/ประสิทธิภาพของ Graviton2 เพื่อปรับใช้โมเดลการเรียนรู้เชิงลึกที่เร่งความเร็วของ GPU ด้วยต้นทุนที่ต่ำกว่าอย่างมากเมื่อเทียบกับอินสแตนซ์ที่ใช้ x86 พร้อมการเร่งด้วย GPU

AWS และ NVIDIA: ประวัติการทำงานร่วมกันอันยาวนาน

AWS และ NVIDIA ได้ร่วมมือกันมานานกว่า 10 ปีเพื่อส่งมอบโซลูชันที่ใช้ GPU ที่มีประสิทธิภาพ คุ้มค่า และยืดหยุ่นให้กับลูกค้าอย่างต่อเนื่อง ซึ่งรวมถึงรุ่นล่าสุด อินสแตนซ์ EC2 G4 ด้วย NVIDIA T4 GPUs ที่เปิดตัวในปี 2019 และ อินสแตนซ์ EC2 P4d ด้วย NVIDIA A100 GPUs ที่เปิดตัวในปี 2020 อินสแตนซ์ EC2 P4d ถูกปรับใช้ในคลัสเตอร์ไฮเปอร์สเกลที่เรียกว่า EC2 UltraClusters ซึ่งประกอบด้วยการประมวลผล เครือข่าย และพื้นที่เก็บข้อมูลที่มีประสิทธิภาพสูงสุดในระบบคลาวด์ EC2 UltraClusters รองรับเครือข่ายอินสแตนซ์ 400 Gbps, Elastic Fabric Adapter (EFA) และเทคโนโลยี NVIDIA GPUDirect RDMA เพื่อช่วยฝึกโมเดล ML อย่างรวดเร็วโดยใช้เทคนิคการขยายขนาดและการกระจาย

นอกเหนือจากการเป็นเจ้าแรกในระบบคลาวด์ที่นำเสนออินสแตนซ์ที่เร่งความเร็วของ GPU และกลุ่มแรกในคลาวด์เพื่อนำเสนอ NVIDIA V100 GPU ตอนนี้เรากำลังทำงานร่วมกับ NVIDIA เพื่อเสนออินสแตนซ์ EC2 ใหม่ที่รวมโปรเซสเซอร์แบบ Arm เข้ากับตัวเร่ง GPU ใน ครึ่งหลังของปี 2021 หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับวิธีที่ AWS และ NVIDIA ทำงานร่วมกันเพื่อนำเทคโนโลยีที่เป็นนวัตกรรมมาสู่ลูกค้า โปรดไปที่ AWS ที่ NVIDIA GTC 21.


เกี่ยวกับผู้เขียน

เจฟฟ์ มูราเสะ เป็นผู้จัดการอาวุโสฝ่ายการตลาดผลิตภัณฑ์สำหรับอินสแตนซ์การประมวลผลแบบเร่งความเร็วของ AWS EC2 ช่วยให้ลูกค้าตอบสนองความต้องการด้านการประมวลผลโดยให้การเข้าถึงตัวเร่งการประมวลผลบนฮาร์ดแวร์ เช่น หน่วยประมวลผลกราฟิก (GPU) หรือ Field Programmable Gate Array (FPGA) ในเวลาว่าง เขาชอบเล่นบาสเก็ตบอลและขี่จักรยานกับครอบครัว

ที่มา: https://aws.amazon.com/blogs/machine-learning/aws-and-nvidia-to-bring-arm-based-instances-with-gpus-to-the-cloud/

ประทับเวลา:

เพิ่มเติมจาก บล็อก AWS Machine Learning