Orca LLM: ChatGPT arutlusprotsesside simuleerimine

Taasavaldanud Platon

järgijaid: 0

Orca LLM: ChatGPT arutlusprotsesside simuleerimine

Suurte keelemudelite (LLM) valdkonnas on püütud pidevalt suurendada väiksemate mudelite võimalusi, ilma et see kahjustaks nende tõhusust. Traditsiooniline lähenemine on olnud imitatsiooniõppe kasutamine, kus väiksemad mudelid õpivad suurte alusmudelite (LFM) genereeritud väljunditest. Seda lähenemisviisi on aga rikkunud mitmed väljakutsed, sealhulgas madalate LFM-väljundite piiratud imitatsioonisignaalid, väikesemahulised homogeensed koolitusandmed ja range hindamise puudumine. See viib sageli väiksemate mudeliteni, mis jäljendavad LFM-ide stiili, kuid mitte arutlusprotsessi.

Paber Orca: Progressive Learning from Complex Explanation Traces of GPT-4 tutvustab Orcat, 13 miljardi parameetriga mudelit, mis on loodud matkima suurte vundamendimudelite (LFM) nagu GPT-4 arutlusprotsessi. Erinevalt traditsioonilistest suurtest keelemudelitest (LLM) kasutab Orca ainulaadset koolitusmeetodit, mis ühendab progressiivse õppimise ja õpetajate abi, et ületada väiksemate õpilasmudelite ja nende suuremate kolleegide vaheline suutlikkus.

Orca koolitusprotsess koosneb kahest etapist.

Esimeses etapis koolitatakse Orcat FLAN-5M-iga, mis sisaldab ChatGPT täiendusi. See vahepealne õpetaja assistent aitab ületada suutlikkuse lõhet Orca ja GPT-4 vahel, mille parameetri suurus on oluliselt suurem. Kasutades ära ChatGPT võimalusi, saab Orca kasu paremast jäljendamise õppimisvõimest.

Teises etapis läbib Orca FLAN-1M koolituse, mis hõlmab GPT-4 täiendusi. See progressiivne õppimisviis järgib õppekavapõhise õppimise paradigmat, kus õpilasmudel õpib lihtsamatest näidetest, enne kui hakkab tegelema keerukamate näidetega. Esitades Orca järk-järgult üha keerukamatele arutluskäikudele ja samm-sammulistele selgitustele, suurendab mudel selle arutlusvõimet ja matkimisoskusi.

Orca koolitusmetoodika pakub traditsiooniliste LLM-ide ees mitmeid eeliseid.

Esiteks lahendab see suutlikkuse puudujäägi probleemi, kasutades vahepealset õpetajamudelit, mis võimaldab Orcal õppida võimekamatest allikatest. On näidatud, et see lähenemisviis parandab väiksemate õpilasmudelite imiteerimise õppimist.

Teiseks võimaldab Orca koolituse progressiivne õppimisaspekt mudelil oma teadmisi järk-järgult edasi arendada. Alustades lihtsamatest näidetest ja tuues järk-järgult kasutusele keerulisemad, loob Orca arutluste ja selgituste genereerimiseks tugevama aluse.

Lisaks avab Orca võime jäljendada LFM-ide, nagu GPT-4, arutlusprotsessi, võimalused erinevate ülesannete paremaks jõudluseks. Kasutades GPT-4 selgitusjälgede ja samm-sammuliste mõtteprotsesside pakutavaid rikkalikke signaale, saab Orca väärtuslikku teavet ja täiustab oma võimeid.

Orca on näidanud märkimisväärset jõudlust keerukate null-shot-arutluskäikude alal. See edestab traditsioonilisi tipptasemel juhistega häälestatud mudeleid, nagu Vicuna-13B, enam kui 100% selliste võrdlusnäitajate puhul nagu Big-Bench Hard (BBH) ja üle 42% AGIEvali puhul. Lisaks saavutab Orca BBH võrdlusalustel samad punktisummad kui ChatGPT ning näitab konkurentsivõimelist tulemust erialastel ja akadeemilistel eksamitel, nagu SAT, LSAT, GRE ja GMAT. See on eriti muljetavaldav, arvestades, et need on null-shot seaded ilma mõtteahelata ja Orca toimib endiselt konkurentsivõimeliselt, jäädes GPT-4 taha.

Orca areng kujutab endast olulist edasiminekut LLM-ide valdkonnas. Rikkalikest signaalidest õppides ja LFM-ide arutlusprotsessi jäljendades suudab Orca täita keerulisi arutlusülesandeid suure täpsusega. Sellel on laiaulatuslikud tagajärjed, eriti valdkondades, kus on vaja keerulist arutluskäiku ja probleemide lahendamist.

Veelgi enam, see uuring näitab, et AI mudelite samm-sammulistest selgitustest õppimine on paljutõotav suund mudelite võimaluste parandamiseks. See avab LLM-ide valdkonnas uusi võimalusi teadus- ja arendustegevuseks.

Orca esitleb uudset lähenemisviisi suurte keelemudelite koolitamiseks, kombineerides järkjärgulist õppimist ja õpetaja abi, et tõhustada imiteerivat õppimist. Kasutades vahepealseid õpetajamudeleid ja tuues õpilase mudeli järk-järgult keerukamatele näidetele, ületab Orca suutlikkuse lünga ja parandab oma arutlus- ja selgitusvõimet. Töö tulemused aitavad kaasa imitatsiooniõppe tehnikate edendamisele ja mõjutavad tulevaste keelemudelite väljatöötamist.

Lisateavet Orca ja selle uuringute kohta leiate veebisaidilt Microsofti tutvustav artikkel ja kaasnev uurimistöö.

Veel selle teema kohta

SEO-põhise sisu ja PR-levi. Võimenduge juba täna.
EVM Finance. Detsentraliseeritud rahanduse ühtne liides. Juurdepääs siia.
Quantum Media Group. IR/PR võimendatud. Juurdepääs siia.
PlatoAiStream. Web3 andmete luure. Täiustatud teadmised. Juurdepääs siia.
Allikas: https://www.kdnuggets.com/2023/06/orca-llm-reasoning-processes-chatgpt.html?utm_source=rss&utm_medium=rss&utm_campaign=orca-llm-simulating-the-reasoning-processes-of-chatgpt

Ajatempel: Juuni 20, 2023

Orca LLM: ChatGPT arutlusprotsesside simuleerimine – KDnuggets

Taasavaldanud Platon

Veel selle teema kohta

Veel alates KDnuggets

Super Bard: AI, mis suudab kõike ja paremini – KDnuggets

Parimad tasuta ressursid vestluse GPT õppimiseks

10 ChatGPT pistikprogrammi andmeteaduse petulehe jaoks – KDnuggets

8. aasta 2024 parimat pilvekonteinerite halduslahendust – KDnuggets

Andmeteaduse miinimum: 10 olulist oskust, mida peate teadma, et alustada andmeteadusega

Avage oma järgmine samm: säästke kuni 67% nõutavatelt andmete täiendamiselt

PyTorchiga alustamine 5 sammuga – KDnuggets

Meist

Vertikaalne otsing ja Ai

Platvorm

Püsi ühenduses

konto