ชิปสมองอันทรงพลังนี้มีประสิทธิภาพมากจนสามารถนำ AI ขั้นสูงมาสู่โทรศัพท์ของคุณได้

โหนดต้นทาง: 1644754
ภาพ

AI กับคอมพิวเตอร์แบบเดิมๆ เป็นสิ่งที่คู่กันในนรก

สาเหตุหลักมาจากการตั้งค่าชิปฮาร์ดแวร์ในปัจจุบัน ตามสถาปัตยกรรม Von Neumann ดั้งเดิม ชิปแยกหน่วยความจำออกจากโปรเซสเซอร์หลัก การคำนวณแต่ละครั้งเป็นการเดินทางที่น่าหวาดเสียวในเช้าวันจันทร์ โดยชิปจะส่งข้อมูลไปมาอย่างต่อเนื่องจากแต่ละช่อง ทำให้เกิดความฉาวโฉ่”ผนังหน่วยความจำ".

หากคุณเคยติดอยู่กับการจราจร คุณจะรู้ว่าความหงุดหงิดนั้นต้องใช้เวลาและสิ้นเปลืองพลังงาน เนื่องจากอัลกอริธึม AI มีความซับซ้อนมากขึ้น ปัญหาก็จะยิ่งแย่ลงเรื่อยๆ

เหตุใดจึงไม่ออกแบบชิปโดยอิงจากสมอง ซึ่งเป็นอุปกรณ์ที่เข้ากันได้อย่างสมบูรณ์แบบกับโครงข่ายประสาทส่วนลึก

ป้อนการประมวลผลในหน่วยความจำหรือ CIM ชิป ชิปเหล่านี้จะคำนวณและจัดเก็บหน่วยความจำไว้ที่ไซต์เดียวกันด้วยความซื่อสัตย์ต่อชื่อ ลืมการเดินทาง ชิปนี้เป็นทางเลือกในการทำงานจากที่บ้านที่มีประสิทธิภาพสูง ขจัดปัญหาคอขวดของการรับส่งข้อมูลและมีแนวโน้มว่าจะมีประสิทธิภาพสูงขึ้นและใช้พลังงานน้อยลง

หรือเป็นไปตามทฤษฎี ชิป CIM ส่วนใหญ่ที่ใช้อัลกอริธึม AI มุ่งเน้นไปที่การออกแบบชิปเพียงอย่างเดียว โดยแสดงความสามารถโดยใช้การจำลองของชิป แทนที่จะทำงานบนฮาร์ดแวร์ที่เต็มเปี่ยม ชิปยังมีปัญหาในการปรับให้เข้ากับงาน AI ต่างๆ เช่น การจดจำภาพ การรับรู้เสียง ซึ่งจำกัดการรวมเข้ากับสมาร์ทโฟนหรืออุปกรณ์อื่นๆ ในชีวิตประจำวัน

ในเดือนนี้ เรียน in ธรรมชาติ อัปเกรด CIM ตั้งแต่เริ่มต้น แทนที่จะมุ่งเน้นไปที่การออกแบบของชิปเพียงอย่างเดียว ทีมงานระหว่างประเทศซึ่งนำโดยผู้เชี่ยวชาญด้านฮาร์ดแวร์ neuromorphic Dr. HS Philip Wong ที่ Stanford และ Dr. Gert Cauwenberghs ที่ UC San Diego ได้ปรับการตั้งค่าทั้งหมดให้เหมาะสมตั้งแต่เทคโนโลยีไปจนถึงสถาปัตยกรรมไปจนถึงอัลกอริธึมที่ปรับเทียบฮาร์ดแวร์ .

ชิป NeuRRAM ที่ได้คือการประมวลผลแบบ neuromorphic อันทรงพลังที่มีแกนคู่ขนาน 48 คอร์และเซลล์หน่วยความจำ 3 ล้านเซลล์ ใช้งานได้หลากหลายมาก ชิปนี้จัดการกับงานมาตรฐาน AI หลายอย่าง เช่น การอ่านตัวเลขที่เขียนด้วยลายมือ การระบุรถยนต์และวัตถุอื่นๆ ในรูปภาพ และการถอดรหัสการบันทึกเสียง ด้วยความแม่นยำมากกว่า 84 เปอร์เซ็นต์

แม้ว่าอัตราความสำเร็จอาจดูธรรมดา แต่ก็สามารถแข่งขันกับชิปดิจิทัลที่มีอยู่ได้ แต่ประหยัดพลังงานได้อย่างมาก สำหรับผู้เขียนแล้ว การนำ AI มาสู่อุปกรณ์ของเราเป็นอีกก้าวที่ใกล้เข้ามาโดยตรง แทนที่จะต้องส่งข้อมูลไปยังคลาวด์เพื่อการคำนวณ

“การคำนวณเหล่านั้นบนชิปแทนที่จะส่งข้อมูลไปและกลับจากคลาวด์สามารถช่วยให้ AI เร็วขึ้น ปลอดภัยขึ้น ถูกกว่า และปรับขนาดได้มากขึ้นในอนาคต และทำให้ผู้คนเข้าถึงพลัง AI ได้มากขึ้น” กล่าวว่า วงศ์

ประสาทแรงบันดาลใจ

ชิปเฉพาะ AI เป็นค่าเล็กน้อยที่น่าอัศจรรย์เป็นโหล ตั้งแต่หน่วยประมวลผล Tensor (TPU) ของ Google และสถาปัตยกรรมซูเปอร์คอมพิวเตอร์ Dojo ของ Tesla ไปจนถึง Baidu และ Amazon ยักษ์ใหญ่ด้านเทคโนโลยีกำลังลงทุนหลายล้านเหรียญในชิป AI เพื่อสร้างโปรเซสเซอร์ที่รองรับอัลกอริธึมการเรียนรู้เชิงลึกที่ซับซ้อนมากขึ้น บ้างก็ได้ ใช้ประโยชน์จากแมชชีนเลิร์นนิงเพื่อออกแบบสถาปัตยกรรมชิป ปรับให้เหมาะกับซอฟต์แวร์ AI นำการแข่งขันเต็มรูปแบบ

แนวคิดที่น่าสนใจอย่างหนึ่งมาจากสมองโดยตรง เมื่อข้อมูลส่งผ่านเซลล์ประสาทของเรา พวกมันจะ "เชื่อมต่อ" เข้ากับเครือข่ายผ่าน "ท่าเทียบเรือ" ทางกายภาพที่เรียกว่าไซแนปส์ โครงสร้างเหล่านี้นั่งอยู่บนกิ่งก้านของระบบประสาทเช่นเห็ดตัวเล็ก ๆ เป็นแบบมัลติทาสก์: ทั้งคู่คำนวณและจัดเก็บข้อมูลผ่านการเปลี่ยนแปลงในองค์ประกอบโปรตีน

กล่าวอีกนัยหนึ่ง เซลล์ประสาท ซึ่งแตกต่างจากคอมพิวเตอร์ทั่วไป ไม่จำเป็นต้องส่งข้อมูลจากหน่วยความจำไปยัง CPU สิ่งนี้ทำให้สมองได้เปรียบเหนืออุปกรณ์ดิจิตอล: มีประสิทธิภาพในการใช้พลังงานสูง และทำการคำนวณหลาย ๆ อย่างพร้อมกัน ทั้งหมดนี้บรรจุลงในเยลลี่น้ำหนัก XNUMX ปอนด์ที่ยัดไว้ภายในกะโหลกศีรษะ

ทำไมไม่สร้างแง่มุมต่าง ๆ ของสมองขึ้นมาใหม่?

เข้าสู่ คอมพิวเตอร์ neuromorphic. หนึ่งแฮ็คคือการใช้ RRAM หรืออุปกรณ์หน่วยความจำเข้าถึงโดยสุ่มแบบต้านทาน (เรียกอีกอย่างว่า 'memristors') RRAM จะจัดเก็บหน่วยความจำแม้ในขณะที่ถูกตัดไฟโดยการเปลี่ยนความต้านทานของฮาร์ดแวร์ เช่นเดียวกับซินแนปส์ ส่วนประกอบเหล่านี้สามารถบรรจุลงในอาร์เรย์ที่มีความหนาแน่นสูงบนพื้นที่เล็กๆ ได้ ทำให้เกิดวงจรที่มีความสามารถในการคำนวณที่ซับซ้อนสูงโดยไม่ต้องมีจำนวนมาก เมื่อรวมกับ CMOS ซึ่งเป็นกระบวนการผลิตสำหรับสร้างวงจรในไมโครโปรเซสเซอร์และชิปปัจจุบันของเรา duo มีพลังมากขึ้น สำหรับการรันอัลกอริธึมการเรียนรู้เชิงลึก

แต่มันมีค่าใช้จ่าย ผู้เขียนกล่าวว่า "การคำนวณแบบอะนาล็อกขนานสูงภายในสถาปัตยกรรม RRAM-CIM ให้ประสิทธิภาพที่เหนือกว่า แต่ทำให้ความท้าทายในการตระหนักถึงความยืดหยุ่นในการทำงานและความแม่นยำในการคำนวณในระดับเดียวกันกับวงจรดิจิทัล"

การเพิ่มประสิทธิภาพ Genie

การศึกษาใหม่เจาะลึกทุกส่วนของชิป RRAM-CIM โดยออกแบบใหม่เพื่อการใช้งานจริง

มันเริ่มต้นด้วยเทคโนโลยี NeuRRAM มี 48 คอร์ที่คำนวณแบบขนาน โดยอุปกรณ์ RRAM จะรวมเข้ากับวงจร CMOS เช่นเดียวกับเซลล์ประสาท แต่ละคอร์สามารถปิดแยกกันได้เมื่อไม่ได้ใช้งาน โดยจะคงพลังงานไว้ในขณะที่หน่วยความจำของแกนถูกเก็บไว้ใน RRAM

เซลล์ RRAM เหล่านี้—ทั้งสามล้านเซลล์—เชื่อมโยงกันเพื่อให้ข้อมูลสามารถถ่ายโอนได้ในทั้งสองทิศทาง เป็นการออกแบบที่สำคัญ ทำให้ชิปสามารถปรับให้เข้ากับอัลกอริธึม AI ประเภทต่างๆ ได้อย่างยืดหยุ่น ผู้เขียนอธิบาย ตัวอย่างเช่น CNN (convolutional neural network) ประเภทหนึ่งของโครงข่ายประสาทเทียมนั้นยอดเยี่ยมเป็นพิเศษในการมองเห็นด้วยคอมพิวเตอร์ แต่ต้องการให้ข้อมูลไหลไปในทิศทางเดียว ในทางตรงกันข้าม LSTM ซึ่งเป็นโครงข่ายประสาทลึกชนิดหนึ่งที่มักใช้ในการจดจำเสียง จะประมวลผลข้อมูลซ้ำๆ เพื่อจับคู่สัญญาณกับเวลา เช่นเดียวกับไซแนปส์ ชิปจะเข้ารหัสว่า "เซลล์ประสาท" RRAM ตัวใดตัวหนึ่งเชื่อมต่อกับอีกตัวหนึ่งได้มากเพียงใด

สถาปัตยกรรมนี้ทำให้สามารถปรับกระแสข้อมูลเพื่อลดการจราจรติดขัดได้ เช่นเดียวกับการขยายทราฟฟิกเลนเดียวไปยังหลายเลน ชิปสามารถทำซ้ำ "หน่วยความจำ" ปัจจุบันของเครือข่ายจากปัญหาที่ต้องใช้การประมวลผลสูงที่สุด เพื่อให้หลายคอร์วิเคราะห์ปัญหาพร้อมกัน

การปรับแต่งขั้นสุดท้ายสำหรับชิป CIM รุ่นก่อนเป็นสะพานเชื่อมที่แข็งแกร่งขึ้นระหว่างการคำนวณแบบสมอง ซึ่งมักจะเป็นการประมวลผลแบบอนาล็อกและแบบดิจิทัล ที่นี่ชิปใช้วงจรเซลล์ประสาทที่สามารถแปลงการคำนวณแบบอะนาล็อกเป็นสัญญาณดิจิทัลได้อย่างง่ายดาย เป็นขั้นตอนที่เพิ่มขึ้นจากการตั้งค่า "หิวพลังงานและพื้นที่หิว" ก่อนหน้านี้ ผู้เขียนอธิบาย

การเพิ่มประสิทธิภาพได้ผล นำทฤษฎีมาทดสอบ ทีมงานได้ผลิตชิป NeuRRAM และพัฒนาอัลกอริธึมเพื่อตั้งโปรแกรมฮาร์ดแวร์สำหรับอัลกอริธึมต่างๆ เช่น Play Station 5 ที่เล่นเกมต่างๆ

ในการทดสอบเกณฑ์มาตรฐานจำนวนมาก ชิปดังกล่าวทำงานได้อย่างยอดเยี่ยม การใช้ CNN เจ็ดชั้นบนชิป NeuRRAM มีอัตราข้อผิดพลาดน้อยกว่าหนึ่งเปอร์เซ็นต์ในการจดจำตัวเลขที่เขียนด้วยลายมือโดยใช้ฐานข้อมูล MNIST ยอดนิยม

มันยังเก่งในงานที่ยากขึ้นอีกด้วย กำลังโหลด LSTM โครงข่ายประสาทลึกที่เป็นที่นิยมอีกตัวหนึ่ง ชิปนั้นถูกต้องประมาณ 85 เปอร์เซ็นต์เมื่อถูกท้าทายด้วยการรู้จำคำสั่งคำพูดของ Google ด้วยการใช้เพียงแปดคอร์ ชิปซึ่งทำงานบนสถาปัตยกรรม AI อื่นสามารถกู้คืนภาพที่มีสัญญาณรบกวนได้ ซึ่งช่วยลดข้อผิดพลาดได้ประมาณ 70 เปอร์เซ็นต์

แล้วไง?

หนึ่งคำ: พลังงาน

อัลกอริทึม AI ส่วนใหญ่เป็นหมูพลังงานทั้งหมด NeuRRAM ดำเนินการด้วยค่าใช้จ่ายด้านพลังงานเพียงครึ่งเดียวของชิป RRAM-CIM อันล้ำสมัยรุ่นก่อน ซึ่งช่วยแปลความหมายเพิ่มเติมของการประหยัดพลังงานด้วยการประมวลผลแบบ neuromorphic ให้กลายเป็นความจริง

แต่ความโดดเด่นของการศึกษาคือกลยุทธ์ บ่อยครั้งเมื่อออกแบบชิป นักวิทยาศาสตร์จำเป็นต้องสร้างสมดุลระหว่างประสิทธิภาพ ความเก่งกาจ และความแม่นยำสำหรับงานที่หลากหลาย—เมตริกที่มักจะขัดแย้งกัน ปัญหาจะยิ่งรุนแรงขึ้นเมื่อประมวลผลทั้งหมดบนฮาร์ดแวร์โดยตรง NeuRRAM แสดงให้เห็นว่าสามารถต่อสู้กับสัตว์ร้ายทั้งหมดได้ในคราวเดียว

กลยุทธ์ที่ใช้ในที่นี้สามารถใช้เพื่อเพิ่มประสิทธิภาพอุปกรณ์คอมพิวเตอร์ neuromorphic อื่นๆ เช่น เทคโนโลยีหน่วยความจำเปลี่ยนเฟสs, ผู้เขียนกล่าวว่า.

สำหรับตอนนี้ NeuRRAM เป็นเครื่องพิสูจน์แนวคิด ซึ่งแสดงให้เห็นว่าชิปจริง—แทนที่จะเป็นการจำลอง—ทำงานตามที่ตั้งใจไว้ แต่ยังมีสิ่งที่ต้องปรับปรุง รวมถึงการปรับขนาด RRAM เพิ่มเติมและการย่อขนาดให้เหลือเพียงวันเดียวที่อาจพอดีกับโทรศัพท์ของเรา

“บางทีวันนี้อาจใช้เพื่อทำงาน AI ธรรมดาๆ เช่น การจำคีย์เวิร์ดหรือการตรวจจับโดยมนุษย์ แต่พรุ่งนี้อาจเปิดประสบการณ์ผู้ใช้ที่แตกต่างไปจากเดิมอย่างสิ้นเชิง ลองนึกภาพการวิเคราะห์วิดีโอแบบเรียลไทม์ร่วมกับการรู้จำคำพูดภายในอุปกรณ์ขนาดเล็ก” กล่าวว่า ผู้เขียนศึกษา ดร. เวียร์ วัน “ในฐานะนักวิจัยและวิศวกร ความทะเยอทะยานของฉันคือการนำนวัตกรรมการวิจัยจากห้องปฏิบัติการมาใช้งานจริง”

เครดิตภาพ: David Baiillot/มหาวิทยาลัยแคลิฟอร์เนีย ซานดิเอโก

ประทับเวลา:

เพิ่มเติมจาก Hub เอกพจน์