Mõisted, mida peaksite teadma enne Transformersiga tutvumist

KDnuggets

Mõisted, mida peaksite teadma enne Transformersiga tutvumist

Big andmedAjatempel: 13. jaanuar 2023 12:00

Allikasõlm: 1894868

Taasavaldanud Platon

järgijaid: 0

Närvivõrgud õpivad numbrite kaudu, nii et iga sõna kaardistatakse vektoritega, et esindada konkreetset sõna. Manustuskihti võib pidada otsingutabeliks, mis salvestab sõnade manuseid ja otsib need indeksite abil.

Mõisted, mida peaksite teadma enne Transformeri kasutamist

Sõnad, millel on sama tähendus, on eukleidilise kauguse/koosinuse sarnasuse poolest lähedased. Näiteks allolevas sõnaesituses on "laupäev", "pühapäev" ja "esmaspäev" seotud sama mõistega, nii et näeme, et sõnad on sarnased.

Mõisted, mida peaksite teadma enne Transformeri kasutamist

Sõna asukoha määramine, Miks on vaja sõna asukohta määrata? kuna trafo kodeerijal pole korduvust nagu korduvatel närvivõrkudel, peame sisendmanustesse lisama teavet positsioonide kohta. Seda tehakse asukohakodeeringu abil. Töö autorid kasutasid sõna asukoha modelleerimiseks järgmisi funktsioone.

Mõisted, mida peaksite teadma enne Transformeri kasutamist

Püüame selgitada positsioonikodeeringut.

Mõisted, mida peaksite teadma enne Transformeri kasutamist

Siin viitab "pos" sõna asukohale jadas. P0 viitab esimese sõna positsioonile; „d” tähendab sõna/märgi manustamise suurust. Selles näites d=5. Lõpuks viitab "i" igale manustamise viiest individuaalsest mõõtmest (st 5, 0, 1,2,3,4, XNUMX, XNUMX)

kui "i" on ülaltoodud võrrandis erinev, saate hunniku erineva sagedusega kõveraid. Asendi manustamise väärtuste lugemine erinevate sageduste suhtes, erinevate väärtuste andmine erinevatel manustamismõõtmetel P0 ja P4 jaoks.

Mõisted, mida peaksite teadma enne Transformeri kasutamist

Selle päring, Q tähistab vektorsõna võtmed K on kõik teised sõnad lauses ja väärtus V tähistab sõna vektorit.

Tähelepanu eesmärk on arvutada välja võtmetermini olulisus võrreldes sama isiku/asja või mõistega seotud päringuterminiga.

Meie puhul on V võrdne Q-ga.

Tähelepanumehhanism annab meile sõna tähtsuse lauses.

Mõisted, mida peaksite teadma enne Transformeri kasutamist

Kui arvutame päringu ja võtmete vahelise normaliseeritud punktkorrutise, saame tensori, mis tähistab üksteise sõnade suhtelist tähtsust päringu jaoks.

Mõisted, mida peaksite teadma enne Transformeri kasutamist

Punktkorrutise Q ja K.T arvutamisel proovime hinnata, kuidas vektorid (st päringu ja võtmete vahelised sõnad) on joondatud, ja tagastame lause iga sõna kaalu.

Seejärel normaliseerime tulemuse d_k ruudus ja funktsioon softmax reguleerib terminid ja skaleerib need ümber 0 ja 1 vahel.

Lõpuks korrutame tulemuse (st kaalud) väärtusega (st kõigi sõnadega), et vähendada ebaoluliste sõnade tähtsust ja keskenduda ainult kõige olulisematele sõnadele.

Mitme peaga tähelepanu väljundvektor lisatakse algsele positsioonilisele sisendile. Seda nimetatakse jääkühenduseks / vahelejätmiseks. Jääkühenduse väljund läbib kihi normaliseerimise. Normaliseeritud jääkväljund suunatakse edasiseks töötlemiseks läbi punktsuunalise edasisaatmisvõrgu.

Mõisted, mida peaksite teadma enne Transformeri kasutamist

Mask on maatriks, mis on sama suur kui tähelepanu skoorid, mis on täidetud nullide ja negatiivsete lõpmatustega.

Mõisted, mida peaksite teadma enne Transformeri kasutamist

Maski põhjuseks on see, et kui võtate maskeeritud skooride pehme maksimumi, muutuvad negatiivsed lõpmatused nulliks, jättes tulevaste märkide jaoks nulli tähelepanu.

See käsib mudelil nendele sõnadele mitte keskenduda.

Funktsiooni Softmax eesmärk on haarata reaalarvud (positiivsed ja negatiivsed) ja muuta need positiivseteks arvudeks, mille summa on 1.

Mõisted, mida peaksite teadma enne Transformeri kasutamist

Ravikumar Naduvin on hõivatud PyTorchi abil NLP-ülesannete loomise ja mõistmisega.

Originaal. Loaga uuesti postitatud.

Veel selle teema kohta

SEO-põhise sisu ja PR-levi. Võimenduge juba täna.
Platoblockchain. Web3 metaversiooni intelligentsus. Täiustatud teadmised. Juurdepääs siia.
Allikas: https://www.kdnuggets.com/2023/01/concepts-know-getting-transformer.html?utm_source=rss&utm_medium=rss&utm_campaign=concepts-you-should-know-before-getting-into-transformer

Ajatempel: Jaanuar 13, 2023

Veel alates KDnuggets

Lõin AI-rakenduse 3 päevaga – KDnuggets

Lõin AI-rakenduse 3 päevaga – KDnuggets

Allikaklaster:

Allikasõlm: 2196805

Ajatempel: August 4, 2023

4 võimalust passiivse sissetuleku teenimiseks ChatGPT abil

4 võimalust passiivse sissetuleku teenimiseks ChatGPT abil

Allikaklaster:

Allikasõlm: 2005045

Ajatempel: Mar 10, 2023

Täiesti 50 tasuta kursuse kogumik andmeteaduse valdamiseks – KDnuggets

Täielik 50 tasuta kursuse kogumik andmeteaduse valdamiseks – KDnuggets

Allikaklaster:

Allikasõlm: 2551893

Ajatempel: Aprill 19, 2024

Edge AI rakenduste jõudluse maksimeerimine – KDnuggets

Allikaklaster:

Allikasõlm: 2311504

Ajatempel: Oktoober 5, 2023

5 tasuta kursust andmeteaduse matemaatika valdamiseks – KDnuggets

5 tasuta kursust andmeteaduse matemaatika valdamiseks – KDnuggets

Allikaklaster:

Allikasõlm: 2548156

Ajatempel: Aprill 15, 2024

Magistriandmete teadus aasta jooksul: ülim juhend taskukohase ja omatempoga õppimiseks – KDnuggets

Magistriandmete teadus aasta jooksul: ülim juhend taskukohase ja omatempoga õppimiseks – KDnuggets

Allikaklaster:

Allikasõlm: 2507185

Ajatempel: Mar 7, 2024

8 Avatud lähtekoodiga alternatiiv ChatGPT-le ja Bardile

8 Avatud lähtekoodiga alternatiiv ChatGPT-le ja Bardile

Allikaklaster:

Allikasõlm: 2050235

Ajatempel: Aprill 6, 2023

Sügav õppimine R-iga – KDnuggets

Sügav õppimine R-iga – KDnuggets

Allikaklaster:

Allikasõlm: 2114895

Ajatempel: Võib 30 2023

5 tasuta platvormi tugeva andmeteaduse portfelli loomiseks – KDnuggets

Allikaklaster:

Allikasõlm: 2309815

Ajatempel: Oktoober 5, 2023

7 parimat tööriista masinõppe katsete jälgimiseks

7 parimat tööriista masinõppe katsete jälgimiseks

Allikaklaster:

Allikasõlm: 1980665

Ajatempel: Veebruar 20, 2023

OpenAI keelemudelite peenhäälestus mürarikkalt märgistatud andmetega

Allikaklaster:

Allikasõlm: 2077011

Ajatempel: Aprill 28, 2023

Levinumad andmeteaduse intervjuu küsimused ja vastused

Allikaklaster:

Allikasõlm: 1860815

Ajatempel: August 5, 2021