เพิ่มประสิทธิภาพ RTL และซอฟต์แวร์ด้วยผลการตรวจสอบพลังงานที่รวดเร็วสำหรับการออกแบบ Billion-Gate

โหนดต้นทาง: 994042

ในชิปทุกตัว พลังงานเป็นปัญหาที่ต้องแก้ไขอย่างต่อเนื่อง นักออกแบบต้องพึ่งพาการผสมผสานระหว่างประสบการณ์และความรู้มาอย่างยาวนานเพื่อรับมือกับภาวะที่กลืนไม่เข้าคายไม่ออกนี้ โดยปกติแล้วต้องรอจนกว่าความพร้อมของซิลิคอนจะทำการวิเคราะห์พลังงานด้วยปริมาณงานซอฟต์แวร์ที่เหมือนจริง อย่างไรก็ตาม เกมนี้ช้าเกินไป เนื่องจากกลายเป็นข้อเสนอที่มีค่าใช้จ่ายสูงและใช้เวลานานในการแก้ไขปัญหาด้านพลังงานหลังซิลิคอน ในบล็อกโพสต์นี้ ฉันจะอธิบายวิธีที่คุณสามารถบรรลุผลการตรวจสอบพลังงานที่ดำเนินการได้ในไม่กี่ชั่วโมงด้วยการออกแบบพันล้านเกตตั้งแต่เนิ่นๆ ด้วยความสามารถนี้ คุณสามารถค้นหาภูมิภาคและกรอบเวลาที่สำคัญสำหรับการใช้พลังงานสูงสุด และด้วยเหตุนี้จึงปรับ RTL และซอฟต์แวร์ของคุณให้เหมาะสม

การดำเนินการวิเคราะห์พลังงานหลังซิลิคอนทำให้เกิดความเสี่ยงในการพลาดสถานการณ์พลังงานสูงที่สำคัญ ซึ่งสามารถสร้างปัญหาด้านต้นทุนและการยอมรับผลิตภัณฑ์ได้อย่างมาก ข้อเสียของการผิดเกี่ยวกับอำนาจ? ลูกค้าสามารถเลือกซื้อชิปรายอื่นได้หากการออกแบบไม่เป็นไปตามเป้าหมายพลังงานที่สัญญาไว้ หรือผู้ออกแบบระบบอาจถูกบังคับให้หมุนกลับประสิทธิภาพของชิปเพื่อรักษาขอบเขตพลังงานเป้าหมาย ซึ่งเป็นการแลกเปลี่ยนที่ไม่เอื้ออำนวยในแอปพลิเคชันที่ต้องพึ่งพาประสิทธิภาพการประมวลผลที่รวดเร็ว ในโพสต์นี้ซึ่งเดิมเผยแพร่บน บล็อก “จากซิลิคอนสู่ซอฟต์แวร์”เราจะมาดูรายละเอียดเกี่ยวกับแอปพลิเคชัน SoC บางส่วนที่การวิเคราะห์กำลังที่แม่นยำเป็นสิ่งจำเป็น

GPUs

แอปพลิเคชัน GPU แบบดั้งเดิมเป็นที่รู้จักโดยการเปรียบเทียบ แต่สิ่งนี้ไม่ได้ทำให้งานวิเคราะห์พลังงานง่ายขึ้น พิจารณา GPU ที่ออกแบบมาสำหรับคอมพิวเตอร์แล็ปท็อป คุณสามารถเรียกใช้การวิเคราะห์พลังงานที่จุดการวัดบางจุดในช่วงเวลาหนึ่ง อย่างไรก็ตาม ด้วยรอบสัญญาณนาฬิกาที่อาจสูงถึง 10 ล้านรอบ แนวทางนี้จึงไม่ครอบคลุมทั้งหมดอย่างชัดเจน ซึ่งเป็นเหตุผลว่าทำไมนักออกแบบจึงต้องอาศัยการประมาณพลังงานที่ดีที่สุด

ปัญญาประดิษฐ์

ในชิปปัญญาประดิษฐ์ (AI) แอปพลิเคชันและชุดซอฟต์แวร์สำหรับแอปพลิเคชันและสถาปัตยกรรม AI ล้วนเป็นดินแดนใหม่ ซึ่งก่อให้เกิดความท้าทายมากขึ้นจากมุมมองของโปรไฟล์พลังงาน ถึงกระนั้น รางวัลที่เป็นไปได้ของการปรับแอปพลิเคชัน AI ให้เหมาะสมสำหรับพลังงานนั้นยอดเยี่ยมมาก ประสิทธิภาพการใช้พลังงานเป็นข้อได้เปรียบที่นักออกแบบชิป AI ชื่นชอบ ควบคู่ไปกับประสิทธิภาพการประมวลผลที่รวดเร็ว

5G

แอปพลิเคชั่นที่มีความสำคัญด้านพลังงานอีกอย่างคือ 5G ซึ่งเกี่ยวกับประสิทธิภาพสูงและความหน่วงต่ำ แอปพลิเคชัน 5G เกี่ยวข้องกับการประมวลผลแบบขนานจำนวนมากและความถี่สูง แต่ด้วยพลังงานที่มีอยู่มากเท่านั้น จึงต้องได้รับการปรับให้เหมาะสมเพื่อให้ทำงานได้อย่างมีประสิทธิภาพ โดยเฉพาะอย่างยิ่งสำหรับชิปวิทยุ

ศูนย์ข้อมูล

ศูนย์ข้อมูล โดยเฉพาะอย่างยิ่งศูนย์ข้อมูลแบบไฮเปอร์สเกล สร้างขึ้นจากชิปที่เร็วและประหยัดพลังงาน ซึ่งสามารถช่วยเพิ่มทรูพุตของระบบโดยรวมได้สูงสุด ด้วยเกทนับพันล้านพร้อมกับปริมาณงานซอฟต์แวร์ที่ซับซ้อน SoC ของศูนย์ข้อมูลจึงมาพร้อมกับการตรวจสอบและความต้องการในการเรียกใช้ซอฟต์แวร์ที่เข้มงวดเป็นพิเศษ

ตอบสนอง

ด้วยรูปแบบที่กะทัดรัดและอายุการใช้งานแบตเตอรี่ที่ยาวนาน อุปกรณ์พกพาเช่นสมาร์ทโฟนจึงไม่สามารถใช้ชิปที่ใช้พลังงานมากเกินไปได้ แม้ว่าเวิร์กโหลดจะมีความซับซ้อนเพิ่มขึ้น อุปกรณ์เหล่านี้—แม้แต่ GPU ที่ต้องใช้พลังงานสูง—ก็ยังต้องสามารถรองรับเวิร์กโหลดเหล่านี้ได้อย่างมีประสิทธิภาพ

Fast Power Emulator แก้ปัญหา Power Profiling Challenge ได้อย่างไร

เนื่องจากการตอบสนองความต้องการด้านพลังงานแบบไดนามิกกลายเป็นเรื่องยากขึ้นเรื่อยๆ นักออกแบบชิปจึงมักมองว่ากำลังเป็นความท้าทายสูงสุดในการตรวจสอบ การตรวจสอบพลังงานแบบไดนามิกจำเป็นต้องค้นหาพลังงานสูงสุด ถึงกระนั้น เหตุการณ์พลังงานสูงสุดที่สำคัญนั้นขับเคลื่อนโดยปริมาณงานซอฟต์แวร์จริง การจำลองสามารถระบุกำลังไฟสูงสุดที่อยู่ด้านบนและด้านล่างของงบประมาณด้านพลังงาน แต่ในการออกแบบพันล้านประตู จะสามารถจับเหตุการณ์วิกฤตที่แท้จริงได้ก็ต่อเมื่อโชคช่วยเท่านั้น เนื่องจากหน้าต่างที่ใช้วิธีการจำลองสามารถพิจารณาได้ก็มีมากเช่นกัน เล็ก. เครื่องมือ Signoff จะให้การวัดพลังงานที่แม่นยำ แต่ถ้าใช้ในหน้าต่างเวลาที่ไม่ถูกต้อง ผู้ออกแบบจะไม่สามารถระบุได้ว่าหน้าต่างใดมีพลังงานสูงสุด

การระบุข้อบกพร่องที่ใช้พลังงานต่ำต้องใช้ปริมาณงานซอฟต์แวร์ การทดสอบขนาดเล็กจะไม่เปิดเผยข้อบกพร่องด้านพลังงานที่ขับเคลื่อนด้วยภาระงานที่เหมือนจริง สิ่งที่จำเป็นคือ:

  • เฟิร์มแวร์และระบบปฏิบัติการจริงในการทดสอบก่อนซิลิคอน
  • การจำลองเพื่อตรวจสอบพลังงานมากกว่าล้านหรือพันล้านรอบ
  • การตรวจสอบพลังงานพรีซิลิกอนสำหรับการดีบัก ซึ่งไม่สามารถทำได้กับซิลิกอนจริง

การจำลองความเร็วสูงช่วยให้ทีมออกแบบดำเนินการตรวจสอบพลังงานได้ตั้งแต่เนิ่นๆ ของวงจรการออกแบบ จึงสามารถลดความเสี่ยงของข้อบกพร่องด้านพลังงานและเป้าหมายด้านพลังงานของ SoC ที่พลาดไปได้ แท้จริงแล้ว power emulator ที่รวดเร็วสามารถเป็นคำตอบสำหรับปัญหาการตรวจสอบพลังงานของฮาร์ดแวร์/ซอฟต์แวร์ ซึ่งให้ความแม่นยำที่ดีกว่าในหน้าต่างที่กว้างขึ้น อีมูเลเตอร์ในอุดมคติจะสามารถรันซ้ำได้หลายครั้งต่อวันกับการออกแบบขนาดใหญ่ที่มีเวิร์กโหลดที่สมจริง เมื่อทำเช่นนี้ นักออกแบบชิปจะได้รับข้อมูลเชิงลึกที่นำไปใช้ได้จริงเกี่ยวกับโปรไฟล์พลังงานของการออกแบบของตน

ข้อมูลเชิงลึกที่นำไปปฏิบัติได้ในไม่กี่ชั่วโมง

ด้วยเวิร์คโหลด SoC หลายพันล้านเกตในใจ Synopsys ได้เปิดตัวระบบจำลอง Synopsys ZeBu® Empower ใหม่สำหรับการตรวจสอบพลังงานฮาร์ดแวร์/ซอฟต์แวร์. มอบประสิทธิภาพการประมวลผลสูงสุด ZeBu เสริมพลัง สามารถทำซ้ำได้หลายครั้งต่อวัน โดยให้ผลลัพธ์ที่ดำเนินการได้ในไม่กี่ชั่วโมง จากโปรไฟล์พลังงานที่ได้ นักออกแบบฮาร์ดแวร์และซอฟต์แวร์สามารถระบุพื้นที่ที่สามารถปรับปรุงพลังงานไดนามิกและการรั่วไหลได้ตั้งแต่เนิ่นๆ ZeBu Empower ใช้ เซิร์ฟเวอร์ ZeBu เทคโนโลยีฮาร์ดแวร์จำลองที่รวดเร็วเพื่อให้เวลาตอบสนองสั้น

ZeBu Empower ยังป้อนบล็อกที่มีความสำคัญต่อพลังงานและหน้าต่างเวลาไปข้างหน้า เครื่องยนต์ Synopsys PrimePower เพื่อเร่งการวิเคราะห์พลังงาน RTL และการส่งสัญญาณพลังงานระดับเกท ทั้ง ZeBu Empower และ PrimePower เป็นส่วนหนึ่งของ โซลูชันพลังงานต่ำที่ขับเคลื่อนด้วยซอฟต์แวร์ของ Synopsys. ภาพในไดอะแกรมด้านล่าง โซลูชันที่ใช้พลังงานต่ำให้การไหลแบบ end-to-end และวิธีการที่ครอบคลุมตั้งแต่การวิเคราะห์สถาปัตยกรรมไปจนถึงการบล็อกการวิเคราะห์พลังงาน RTL ไปจนถึงการวิเคราะห์พลังงาน SoC และการเพิ่มประสิทธิภาพ

ไดอะแกรม ZeBu Empower rtl

โซลูชันพลังงานต่ำที่ขับเคลื่อนด้วยซอฟต์แวร์ของ Synopsys ได้รับการออกแบบมาเพื่อช่วยลดการใช้พลังงานไดนามิกและสแตติกโดยรวมของไอซี

สรุป

กำลังอาจเป็นส่วนที่ท้าทายที่สุดของสมการกำลัง ประสิทธิภาพ และพื้นที่ (PPA) และเมื่อพูดถึงการออกแบบหลายพันล้านเกต ความซับซ้อนในการบรรลุโปรไฟล์พลังงานที่แม่นยำก็เพิ่มมากขึ้นเท่านั้น อย่างไรก็ตาม ด้วยโซลูชันการจำลองพลังงานที่รวดเร็วจาก Synopsys ทีมออกแบบสามารถค้นหาภูมิภาคและกรอบเวลาที่สำคัญสำหรับพลังงานสูงสุดได้ ดังนั้นพวกเขาจึงสามารถเพิ่มประสิทธิภาพ RTL และซอฟต์แวร์ของตนได้ ด้วยการใช้ประโยชน์จากโฟลว์พลังงานต่ำของ Synopsys ที่ครอบคลุม นักออกแบบจะได้รับเครื่องมือที่สามารถช่วยให้พวกเขาบรรลุเป้าหมาย PPA ได้ เมื่อพิจารณาถึงภาระงานจำนวนมากและความต้องการด้านประสิทธิภาพของแอปพลิเคชัน เช่น GPU, AI, 5G, ศูนย์ข้อมูล และอุปกรณ์เคลื่อนที่ โซลูชันใดก็ตามที่สามารถให้ภาพพลังงานที่แม่นยำยิ่งขึ้นควรเป็นส่วนเสริมที่น่ายินดีสำหรับชุดเครื่องมือ PPA ของนักออกแบบ

แชร์โพสต์นี้ผ่าน: ที่มา: https://semiwiki.com/eda/synopsys/301320-optimize-rtl-and-software-with-fast-power-verification-results-for-billion-gate-designs/

ประทับเวลา:

เพิ่มเติมจาก กึ่งวิกิ