Outlook 2024 با دا چوانگ از Expedera - Semiwiki

Outlook 2024 با دا چوانگ از Expedera – Semiwiki

گره منبع: 2508131

دا چوانگ 2

Expedera IP نیمه هادی موتور عصبی قابل تنظیمی را ارائه می دهد که عملکرد، قدرت و تأخیر را به طور چشمگیری بهبود می بخشد و در عین حال هزینه و پیچیدگی را در برنامه های استنتاج هوش مصنوعی لبه کاهش می دهد. دا یکی از بنیانگذاران و مدیرعامل Expedera است. پیش از این، او یکی از بنیانگذاران و مدیر عامل Memoir Systems، یک راه اندازی IP حافظه بهینه شده بود که منجر به خرید موفقیت آمیز سیسکو شد. در سیسکو، او ASIC های Datacenter Switch را برای محصولات Nexus 3/9K، MDS، CSPG رهبری کرد. دا بیش از 25 سال تجربه ASIC را در Cisco، Nvidia و Abrizio به ارمغان می آورد. او دارای مدرک BS EECS از UC Berkeley، MS/PhD EE از استانفورد است. دفتر مرکزی این شرکت در سانتا کلارا، کالیفرنیا، دارای مراکز توسعه مهندسی و دفاتر پشتیبانی مشتری در بریتانیا، چین، ژاپن، تایوان و سنگاپور است.

کمی از خودتان و شرکتتان بگویید.

نام من دا چوانگ است و من یکی از بنیانگذاران و مدیرعامل Expedera هستم. Expedera که در سال 2018 تأسیس شد، شهرت ما را در ارائه بهترین IP NPU قابل تنظیم برای برنامه‌های استنتاج لبه از نودهای لبه و تلفن‌های هوشمند گرفته تا خودروسازی به دست آورده است. Origin NPU ما، اکنون در 4 استthمعماری تولید، تا 128 TOPS را در یک هسته پشتیبانی می‌کند و در عین حال پردازش‌های پیشرو در صنعت و بازده انرژی را برای گسترده‌ترین طیف شبکه‌های عصبی از جمله RNN، CNN، LSTM، DNN و LLM ارائه می‌کند.

- هیجان انگیزترین نقطه اوج سال 2023 برای شرکت شما چه بود؟

>>2023 سال رشد فوق العاده ای برای Expedera بود. ما دو مکان فیزیکی جدید به شرکت خود اضافه کردیم، Bath (بریتانیا) و سنگاپور. هر دوی این دفاتر بر تحقیق و توسعه آینده، توسعه معماری‌های هوش مصنوعی نسل بعدی، به‌علاوه چیزهای دیگری که در ماه‌ها و سال‌های آینده درباره آن‌ها خواهید شنید، متمرکز هستند. در حالی که این برای ما بسیار هیجان انگیز است، شاید مهم ترین نقطه اوج Expedera در سال 2023 رشد مشتری و استقرار ما باشد. ما سال را با این خبر شروع کردیم که IP ما در بیش از 10 میلیون دستگاه مصرف کننده ارسال شده است، که عدد قابل توجهی برای هر راه اندازی IP نیمه هادی است. در طول سال، ما به گسترش پایگاه مشتریان خود ادامه دادیم، که در حال حاضر شامل تولیدکنندگان تلفن‌های هوشمند سطح 1 در سراسر جهان، چیپ‌ست‌های دستگاه‌های مصرفی و سازندگان تراشه‌های خودرو می‌شود. راه حل NPU ما در سطح جهانی به عنوان بهترین در بازار شناخته شده است و مشتریان زمانی که بهترین موتور هوش مصنوعی را برای محصولات خود می خواهند به ما مراجعه می کنند.

-بزرگترین چالشی که شرکت شما در سال 2023 با آن مواجه شد چه بود؟

>>بزرگترین چالش در سال 2023، همراه با بزرگترین فرصت، ظهور مدل های زبان بزرگ (LLM) و انتشار پایدار (SD) در فضای هوش مصنوعی لبه بوده است. LLM/SD نشان دهنده یک تغییر پارادایم در هوش مصنوعی است – آنها نیاز به پردازش تخصصی تر و اسب بخار پردازش بیشتری نسبت به شبکه های معمولی CNN/RNN دارند که اکثر مشتریان در سال 2022 و قبل از آن مستقر بودند. تعداد زیادی از برنامه های کاربردی مبتنی بر LLM/SD که مشتریان ما اجرا می کنند باورنکردنی بوده است. با این حال، چالش اصلی LLM و SD در لبه، اجازه دادن به آن شبکه‌ها برای اجرا در محدوده قدرت و عملکرد یک دستگاه لبه با باتری است.

-کار شرکت شما برای رسیدگی به این بزرگترین چالش چگونه است؟

>> مشتریان ما می خواهند محصولاتی را ارائه دهند که دارای هوش مصنوعی هستند. محصولاتی که با تجربه کاربری فوق العاده، ارزش واقعی را برای مصرف کننده به ارمغان می آورند. با این حال، ضربه های قابل توجهی به عمر باتری به عنوان بخشی از تجربه کاربر پذیرفته نمی شود. همانطور که ما پشتیبانی LLM و SD را در نسخه 4 فعلی خود ادغام کردیمth معماری نسل، تأکید طراحی ما بر ارائه کارآمدترین حافظه، بالاترین استفاده و کمترین تأخیر IP NPU است که احتمالاً می‌توانیم بسازیم. ما در کار اساسی این انواع شبکه جدید حفاری کردیم. حرکات داده ها، انتشار، وابستگی ها، و غیره... برای درک راه درست برای تکامل معماری سخت افزاری و نرم افزاری ما برای مطابقت با نیازهای آینده. به عنوان نمونه ای از چگونگی تکامل ما، 4 ماth معماری نسل دارای ضرب ماتریس جدید و بلوک های برداری است که برای LLM و SD بهینه شده اند، در حالی که کارایی پردازش پیشرو در بازار را در شبکه های سنتی RNN و CNN حفظ می کند.

-به نظر شما بزرگترین منطقه رشد برای سال 2024 چه خواهد بود و چرا؟

>> یکی از بزرگترین زمینه های رشد ما این است که سال 2024 از تنوع فزاینده ای از استقرار هوش مصنوعی در خودروها پشتیبانی می کند. در حالی که بیشتر افراد به احتمال زیاد با استفاده از هوش مصنوعی در پشته رانندگی مستقل برای شبکه‌های مبتنی بر بصری آشنا هستند، فرصت‌ها و کاربردهای بیشتری وجود دارد که در حال ظهور هستند. مطمئناً، مانند بسیاری از بازارهای دیگر، شاهد افزایش سرسام آور استفاده از LLM در خودروها هستیم. با این حال، ما همچنین شاهد افزایش استفاده از هوش مصنوعی در سایر جنبه‌های خودرو هستیم - توجه راننده، تشخیص سرنشینان صندلی عقب، سرگرمی اطلاعاتی، نگهداری پیش‌بینی‌کننده، شخصی‌سازی و بسیاری موارد دیگر. همه اینها با هدف ارائه بهترین تجربه کاربری ممکن به مصرف کننده است که یکی از دلایل کلیدی برای پیاده سازی هوش مصنوعی است. با این حال، نیازهای پردازش هوش مصنوعی در همه این کاربردها به طور چشمگیری متفاوت است، نه تنها در قابلیت های عملکرد واقعی، بلکه در انواع شبکه های عصبی مورد استفاده ارائه می شود.

-کار شرکت شما برای رسیدگی به این رشد چگونه است؟

>> همراه با پشتیبانی LLM و SD فوق الذکر، Expedera's 4th معماری نسل نیز به راحتی قابل تنظیم است. هنگامی که Expedera با یک مشتری درگیر طراحی جدید می شود، ما به دنبال درک تمام شرایط برنامه (اهداف عملکرد، پشتیبانی شبکه مورد نیاز، محدودیت های منطقه و قدرت، نیازهای آینده و موارد دیگر) هستیم تا بتوانیم IP خود را به بهترین شکل شخصی سازی کنیم. ، دقیقاً همان چیزی را که مشتری می خواهد بدون نیاز به فداکاری برای چیزهایی که نمی خواهد به او بدهید. اگر مشتری یک موتور متمرکز و با کارایی بالا را بخواهد که کاربردهای مختلف و پشتیبانی از شبکه‌های مختلف را ارائه می‌دهد، ما می‌توانیم از آن پشتیبانی کنیم. اگر مشتری بخواهد موتورهای غیرمتمرکز را استقرار دهد که تنها وظایف و شبکه‌های خاصی را انجام می‌دهند، ما می‌توانیم آن را نیز پشتیبانی کنیم - یا در هر نقطه‌ای از این بین. و همه اینها از همان معماری IP است که بدون جریمه های زمانی تا بازار انجام می شود.

-در سال 2023 در چه کنفرانس هایی شرکت کردید و ترافیک چگونه بود؟

>>Expedera در یک گروه هدف از کنفرانس‌های متمرکز بر هوش مصنوعی لبه‌ای، از جمله اما نه محدود به Embedded Vision Summit و AI Hardware & AI Summit، و همچنین رویدادهای بزرگ‌تری مانند CES، به نمایش می‌گذارد. ترافیک در این رویدادها برابر با سال 2022 به نظر می رسید، که می توان گفت قابل احترام است. بدیهی است که هوش مصنوعی امروزه موضوعی بسیار داغ در دنیای فناوری است و هر شرکتی به دنبال راه هایی برای ادغام هوش مصنوعی در محصولات، گردش کار و فرآیند طراحی خود است. بر این اساس، ما شاهد تنوع روزافزون شرکت کنندگان در این رویدادها بوده ایم که همگی با نیازها و انتظارات متفاوتی آمده اند.

-آیا در کنفرانس های سال 2024 شرکت خواهید کرد؟ همان یا بیشتر؟

>>2024 احتمالاً شاهد گسترش جزئی برنامه های کنفرانس ما، به ویژه برنامه های متمرکز بر فناوری خواهیم بود. به عنوان بخشی از اکوسیستم نیمه هادی، Expedera نمی تواند در خلاء وجود داشته باشد. ما در رویدادهای گذشته در مورد پشته‌های سخت‌افزار و نرم‌افزار و همچنین پیاده‌سازی‌هایی مانند NPU همیشه حسگر امنیت محور برای تلفن‌های هوشمند صحبت کرده‌ایم. امسال، ما زمان زیادی را صرف جزئیات پیاده‌سازی لبه‌های LLM خواهیم کرد، از جمله در کنفرانس‌های آینده اواخر بهار امسال. ما مشتاقانه منتظر دیدار بسیاری از شما در آنجا هستیم!

همچنین خواندن:

Expedera انتشار پایدار را به عنوان معیار برای سخت افزار Edge برای هوش مصنوعی پیشنهاد می کند

وبینار: یک موتور پردازش عصبی ایده آل برای استقرارهای همیشه حسگر

استنتاج هوش مصنوعی منطقه ای بهینه شده برای برنامه های کاربردی حساس به هزینه

اشتراک گذاری این پست از طریق:

تمبر زمان:

بیشتر از نیمه ویکی