Optimalizálja az RTL-t és a szoftvert gyors teljesítmény-ellenőrzési eredményekkel a milliárd kapus tervekhez

Forrás csomópont: 994042

Minden chipben a teljesítmény progresszív probléma, amelyet meg kell oldani. A tervezőknek régóta a tapasztalatok és a tudás kombinációjára kellett hagyatkozniuk ennek a dilemmának a megoldása érdekében, jellemzően a szilícium rendelkezésre állásáig kell várniuk ahhoz, hogy reális szoftveres terhelés mellett teljesítményelemzést hajtsanak végre. Ez azonban már túl késő a játékban, mivel költséges és időigényes megoldás lesz a szilícium utáni energiaproblémák megoldására. Ebben a blogbejegyzésben elmagyarázom, hogyan érhetsz el korán, órákon belül működő teljesítmény-ellenőrzési eredményeket milliárdkapu-konstrukciók esetén. Ezzel a képességgel megtalálhatja a kritikus régiókat és időablakokat a csúcsteljesítményhez, és ezáltal optimalizálhatja RTL-jét és szoftverét.

A szilícium utáni teljesítményelemzés végrehajtása magában foglalja a kritikus nagy teljesítményű helyzetek hiányának kockázatát, ami jelentős költség- és termékbevezetési problémákat okozhat. A hatalommal kapcsolatos tévedés árnyoldalai? Az ügyfél dönthet úgy, hogy másik chipgyártót választ, ha egy terv nem teljesíti az ígért teljesítménycélt. Vagy a rendszertervező kénytelen visszahívni a chip teljesítményét a megcélzott teljesítményboríték fenntartása érdekében – ez kedvezőtlen kompromisszum a gyors számítási teljesítményre támaszkodó alkalmazásokban. Ebben a bejegyzésben, amely eredetileg a „A szilíciumtól a szoftverig” blog, közelebbről megvizsgálunk néhány SoC alkalmazási területet, ahol elengedhetetlen a pontos teljesítményelemzés.

GPU

A hagyományos GPU-alkalmazások ehhez képest ismert entitások, de ez nem könnyíti meg az energiaelemzési feladatot. Tekintsünk egy laptop számítógéphez tervezett GPU-t. A teljesítményelemzést bizonyos mérési pontokon futtathatja egy bizonyos időtartamon keresztül. Azonban a potenciálisan akár 10 millió órajellel ez a megközelítés nyilvánvalóan nem teljes – ezért a tervezőknek hagyományosan a legjobb teljesítménybecsléseikre kellett hagyatkozniuk.

Mesterséges Intelligencia

A mesterséges intelligencia (AI) chipekben az alkalmazások, valamint a mesterséges intelligencia-alkalmazásokhoz és architektúrákhoz tartozó szoftvercsomag mind új területet jelent, ami több kihívást jelent a teljesítményprofilozás szempontjából. A mesterséges intelligencia-alkalmazások teljesítményre optimalizálása azonban nagyszerű lehet. Az energiahatékonyság végül is olyan előny, amelyet a mesterséges intelligencia chip-tervezői szívesen hirdetnének, valamint a gyors számítási teljesítmény.

5G

Egy másik energiakritikus alkalmazás az 5G, amely a nagy teljesítményről és az alacsony késleltetésről szól. Az 5G-alkalmazások sok párhuzamos feldolgozást és magas frekvenciákat foglalnak magukban, de mivel csak ennyi áram áll rendelkezésre, optimalizálni kell őket a hatékony működéshez. Ez különösen igaz a rádiófejes chipekre.

adatközpontok

Az adatközpontok, különösen a nagyméretű adatközpontok villámgyors, energiahatékony chipekre épülnek, amelyek segíthetnek maximalizálni a rendszer teljes átvitelét. A több milliárd kapuval és az összetett szoftveres munkaterheléssel az adatközponti SoC-k különösen szigorú ellenőrzési és szoftverbeállítási követelményeket támasztanak.

Mobil

Tekintettel kompakt formájukra és a kívánt hosszú akkumulátor-üzemidőre, a mobileszközök, például az okostelefonok nem engedhetik meg maguknak a túl sok energiát fogyasztó chipek használatát. Noha a munkaterhelésük egyre bonyolultabbá vált, ezeknek az eszközöknek – még az energiaéhes GPU-knak is – továbbra is képeseknek kell lenniük arra, hogy hatékonyan kezeljék ezeket a terheléseket.

Hogyan oldja meg a Fast Power Emulator a teljesítményprofilozási kihívást

Mivel a dinamikus teljesítménykövetelmények teljesítése egyre nehezebbé válik, a chiptervezők gyakran a teljesítményt tartják a legfőbb ellenőrzési kihívásnak. A dinamikus teljesítmény ellenőrzéséhez a csúcsteljesítmény megtalálása szükséges. A kritikus csúcsteljesítmény-eseményeket azonban a tényleges szoftvermunka okozza. A szimuláció képes azonosítani azt a csúcsteljesítményt, amely az energiaköltségvetés fölé és alá esik, de a milliárdos kapus kiviteleknél csak szerencsével tudja megfogni a valós kritikus eseményeket, mivel a szimuláción alapuló megközelítés által figyelembe vett ablakok túlságosan is jók. kicsi. Egy aláíró eszköz pontos teljesítménymérést biztosítana, de ha nem megfelelő időablakon használják, a tervező nem tudná meghatározni, hogy melyik ablaknak van a legnagyobb teljesítménye.

Az alacsony fogyasztású hibák azonosításához szoftveres munkaterhelések futtatása szükséges. A kis tesztek nem fednek fel reális, munkaterhelés-vezérelt teljesítményhibákat. Amire szükség van:

  • Valódi firmware és operációs rendszer a szilícium előtti tesztelés során
  • Emuláció a teljesítmény ellenőrzésére több millió vagy milliárd cikluson keresztül
  • Szilícium előtti teljesítményellenőrzés a hibakereséshez, ami nem lehetséges a tényleges szilíciummal

A nagysebességű emuláció lehetővé teszi a tervezőcsapatok számára, hogy a tervezési ciklus elején hajtsák végre az energiaellenőrzést, így minimalizálhatják az áramellátási hibák és az elmulasztott SoC energiacélok kockázatát. Valójában a gyors teljesítményű emulátor megoldást jelenthet a hardver/szoftver teljesítmény-ellenőrzési dilemmájára, nagyobb pontosságot biztosítva egy szélesebb ablakban. Az ideális emulátor naponta többszöri iterációt tudna futtatni nagy terveken reális munkaterhelés mellett. Ezzel a chiptervezők gyakorlati betekintést nyerhetnek tervezéseik teljesítményprofiljába.

Cselekvő betekintések órák alatt

A több milliárd kapus SoC munkaterhelést szem előtt tartva, A Synopsys bemutatta új Synopsys ZeBu® Empower emulációs rendszerét a hardver/szoftver teljesítményének ellenőrzéséhez. Maximális számítási teljesítmény biztosítása, ZeBu Empower napi többszöri iterációt tud végrehajtani, órák alatt gyakorlati eredményeket biztosítva. A kapott teljesítményprofilok alapján a hardver- és szoftvertervezők már korán azonosíthatják azokat a területeket, ahol javíthatják a dinamikus és a szivárgási teljesítményt. ZeBu Empower használja ZeBu szerver gyors emulációs hardvertechnológia a rövid átfutási idők biztosítása érdekében.

A ZeBu Empower előremenő teljesítménykritikus blokkokat és időablakokat is betáplál a rendszerbe Synopsys PrimePower motor az RTL teljesítményelemzés és a kapuszintű áramellátás felgyorsítása érdekében. A ZeBu Empower és a PrimePower is része a Synopsys szoftvervezérelt alacsony fogyasztású megoldás. Az alábbi ábrán látható kis fogyasztású megoldás egy végponttól végpontig terjedő áramlást és módszertant kínál, amely az architektúraelemzéstől a blokk RTL energiaelemzésen át az SoC teljesítményelemzéséig és -optimalizálásig terjed.

ZeBu Empower diagram rtl

A Synopsys szoftvervezérelt alacsony fogyasztású megoldást úgy tervezték, hogy segítsen csökkenteni az IC-k általános dinamikus és statikus energiafogyasztását.

Összegzésként

A teljesítmény talán a legnagyobb kihívást jelentő része a teljesítmény, teljesítmény és terület (PPA) egyenletnek. Ha pedig több milliárd kapus tervekről van szó, a pontos teljesítményprofilok elérésének bonyolultsága csak nő. A Synopsys gyors teljesítmény emulációs megoldásával azonban a tervezőcsapatok mostantól megtalálhatják a kritikus régiókat és időablakokat a csúcsteljesítményhez, így optimalizálhatják RTL-jüket és szoftvereiket. Az átfogó Synopsys alacsony fogyasztású áramlás előnyeinek kihasználásával a tervezők olyan eszközökhöz jutnak, amelyek segíthetik őket PPA-céljaik elérésében. Tekintettel a GPU-k, mesterséges intelligencia, 5G, adatközpontok és mobil alkalmazások nagy munkaterhelésére és teljesítményigényére, minden olyan megoldás, amely pontosabb teljesítményképet tud nyújtani, üdvözlendő kiegészítője lehet bármely tervező PPA-eszközkészletének.

Oszd meg ezt a bejegyzést ezen keresztül: Forrás: https://semiwiki.com/eda/synopsys/301320-optimize-rtl-and-software-with-fast-power-verification-results-for-billion-gate-designs/

Időbélyeg:

Még több Semiwiki