Orca LLM: ChatGPT arutlusprotsesside simuleerimine – KDnuggets

Orca LLM: ChatGPT arutlusprotsesside simuleerimine – KDnuggets

Allikasõlm: 2140713

 
Orca LLM: ChatGPT arutlusprotsesside simuleerimine

Orca LLM: ChatGPT arutlusprotsesside simuleerimine

Suurte keelemudelite (LLM) valdkonnas on püütud pidevalt suurendada väiksemate mudelite võimalusi, ilma et see kahjustaks nende tõhusust. Traditsiooniline lähenemine on olnud imitatsiooniõppe kasutamine, kus väiksemad mudelid õpivad suurte alusmudelite (LFM) genereeritud väljunditest. Seda lähenemisviisi on aga rikkunud mitmed väljakutsed, sealhulgas madalate LFM-väljundite piiratud imitatsioonisignaalid, väikesemahulised homogeensed koolitusandmed ja range hindamise puudumine. See viib sageli väiksemate mudeliteni, mis jäljendavad LFM-ide stiili, kuid mitte arutlusprotsessi.

Paber Orca: Progressive Learning from Complex Explanation Traces of GPT-4 tutvustab Orcat, 13 miljardi parameetriga mudelit, mis on loodud matkima suurte vundamendimudelite (LFM) nagu GPT-4 arutlusprotsessi. Erinevalt traditsioonilistest suurtest keelemudelitest (LLM) kasutab Orca ainulaadset koolitusmeetodit, mis ühendab progressiivse õppimise ja õpetajate abi, et ületada väiksemate õpilasmudelite ja nende suuremate kolleegide vaheline suutlikkus.

 
Orca koolitusprotsess koosneb kahest etapist.

Esimeses etapis koolitatakse Orcat FLAN-5M-iga, mis sisaldab ChatGPT täiendusi. See vahepealne õpetaja assistent aitab ületada suutlikkuse lõhet Orca ja GPT-4 vahel, mille parameetri suurus on oluliselt suurem. Kasutades ära ChatGPT võimalusi, saab Orca kasu paremast jäljendamise õppimisvõimest.

Teises etapis läbib Orca FLAN-1M koolituse, mis hõlmab GPT-4 täiendusi. See progressiivne õppimisviis järgib õppekavapõhise õppimise paradigmat, kus õpilasmudel õpib lihtsamatest näidetest, enne kui hakkab tegelema keerukamate näidetega. Esitades Orca järk-järgult üha keerukamatele arutluskäikudele ja samm-sammulistele selgitustele, suurendab mudel selle arutlusvõimet ja matkimisoskusi.

 
Orca koolitusmetoodika pakub traditsiooniliste LLM-ide ees mitmeid eeliseid.

Esiteks lahendab see suutlikkuse puudujäägi probleemi, kasutades vahepealset õpetajamudelit, mis võimaldab Orcal õppida võimekamatest allikatest. On näidatud, et see lähenemisviis parandab väiksemate õpilasmudelite imiteerimise õppimist.

Teiseks võimaldab Orca koolituse progressiivne õppimisaspekt mudelil oma teadmisi järk-järgult edasi arendada. Alustades lihtsamatest näidetest ja tuues järk-järgult kasutusele keerulisemad, loob Orca arutluste ja selgituste genereerimiseks tugevama aluse.

Lisaks avab Orca võime jäljendada LFM-ide, nagu GPT-4, arutlusprotsessi, võimalused erinevate ülesannete paremaks jõudluseks. Kasutades GPT-4 selgitusjälgede ja samm-sammuliste mõtteprotsesside pakutavaid rikkalikke signaale, saab Orca väärtuslikku teavet ja täiustab oma võimeid.

Orca on näidanud märkimisväärset jõudlust keerukate null-shot-arutluskäikude alal. See edestab traditsioonilisi tipptasemel juhistega häälestatud mudeleid, nagu Vicuna-13B, enam kui 100% selliste võrdlusnäitajate puhul nagu Big-Bench Hard (BBH) ja üle 42% AGIEvali puhul. Lisaks saavutab Orca BBH võrdlusalustel samad punktisummad kui ChatGPT ning näitab konkurentsivõimelist tulemust erialastel ja akadeemilistel eksamitel, nagu SAT, LSAT, GRE ja GMAT. See on eriti muljetavaldav, arvestades, et need on null-shot seaded ilma mõtteahelata ja Orca toimib endiselt konkurentsivõimeliselt, jäädes GPT-4 taha.

Orca areng kujutab endast olulist edasiminekut LLM-ide valdkonnas. Rikkalikest signaalidest õppides ja LFM-ide arutlusprotsessi jäljendades suudab Orca täita keerulisi arutlusülesandeid suure täpsusega. Sellel on laiaulatuslikud tagajärjed, eriti valdkondades, kus on vaja keerulist arutluskäiku ja probleemide lahendamist.

Veelgi enam, see uuring näitab, et AI mudelite samm-sammulistest selgitustest õppimine on paljutõotav suund mudelite võimaluste parandamiseks. See avab LLM-ide valdkonnas uusi võimalusi teadus- ja arendustegevuseks.

 
Orca esitleb uudset lähenemisviisi suurte keelemudelite koolitamiseks, kombineerides järkjärgulist õppimist ja õpetaja abi, et tõhustada imiteerivat õppimist. Kasutades vahepealseid õpetajamudeleid ja tuues õpilase mudeli järk-järgult keerukamatele näidetele, ületab Orca suutlikkuse lünga ja parandab oma arutlus- ja selgitusvõimet. Töö tulemused aitavad kaasa imitatsiooniõppe tehnikate edendamisele ja mõjutavad tulevaste keelemudelite väljatöötamist.

Lisateavet Orca ja selle uuringute kohta leiate veebisaidilt Microsofti tutvustav artikkel ja kaasnev uurimistöö.
 

Ajatempel:

Veel alates KDnuggets