Käsitteet, jotka sinun tulee tietää ennen Transformersin aloittamista

KDnuggets

Käsitteet, jotka sinun tulee tietää ennen Transformersin aloittamista

Big DataAikaleima: 13. tammikuuta 2023 12

Lähdesolmu: 1894868

Julkaissut Platon

seuraajia: 0

Neuroverkot oppivat numeroiden kautta, joten jokainen sana kartoitetaan vektoreihin edustamaan tiettyä sanaa. Upotuskerrosta voidaan pitää hakutaulukona, joka tallentaa sanan upotukset ja hakee ne indeksien avulla.

Käsitteet, jotka sinun tulee tietää ennen Transformeriin siirtymistä

Sanat, joilla on sama merkitys, ovat läheisiä euklidisen etäisyyden/kosinin samankaltaisuuden suhteen. esimerkiksi alla olevassa sanamuodossa "lauantai", "sunnuntai" ja "maanantai" liittyvät samaan käsitteeseen, joten voimme nähdä, että sanat ovat samanlaisia.

Käsitteet, jotka sinun tulee tietää ennen Transformeriin siirtymistä

Sanan sijainnin määrittäminen, Miksi meidän on määritettävä sanan sijainti? koska muuntajakooderilla ei ole toistumista, kuten toistuvilla hermoverkoilla, meidän on lisättävä jonkin verran tietoa paikoista sisääntulon upotuksiin. Tämä tehdään paikkakoodauksella. Paperin kirjoittajat käyttivät seuraavia funktioita mallintaakseen sanan sijainnin.

Käsitteet, jotka sinun tulee tietää ennen Transformeriin siirtymistä

Yritämme selittää sijaintikoodauksen.

Käsitteet, jotka sinun tulee tietää ennen Transformeriin siirtymistä

Tässä "pos" tarkoittaa "sanan" paikkaa sekvenssissä. P0 viittaa ensimmäisen sanan paikan upottamiseen; "d" tarkoittaa sanan/tunnisteen upotuksen kokoa. Tässä esimerkissä d=5. Lopuksi "i" viittaa jokaiseen upotuksen viidestä yksittäisestä ulottuvuudesta (eli 5, 0, 1,2,3,4, XNUMX, XNUMX)

jos "i" vaihtelee yllä olevassa yhtälössä, saat joukon käyriä, joiden taajuudet vaihtelevat. Lukea sijainnin upotusarvot eri taajuuksia vastaan, antaa eri arvot eri upotusmitoilla P0:lle ja P4:lle.

Käsitteet, jotka sinun tulee tietää ennen Transformeriin siirtymistä

Tässä kysely, Q edustaa vektorisanaa, the avaimet K ovat kaikki muut sanat lauseessa ja arvo V edustaa sanan vektoria.

Huomion tarkoituksena on laskea avaintermin tärkeys verrattuna samaan henkilöön/asiaan tai käsitteeseen liittyvään kyselytermiin.

Meidän tapauksessamme V on yhtä suuri kuin Q.

Huomiomekanismi antaa meille sanan merkityksen lauseessa.

Käsitteet, jotka sinun tulee tietää ennen Transformeriin siirtymistä

Kun laskemme normalisoidun pistetulon kyselyn ja avainten välillä, saamme tensorin, joka edustaa toistensa sanojen suhteellista merkitystä kyselylle.

Käsitteet, jotka sinun tulee tietää ennen Transformeriin siirtymistä

Kun lasketaan pistetuloa Q:n ja KT:n välillä, yritämme arvioida, kuinka vektorit (eli kyselyn ja avainten väliset sanat) on kohdistettu, ja palauttaa painotuksen jokaiselle lauseen sanalle.

Sitten normalisoimme tuloksen d_k:n neliöllä ja softmax-funktio normalisoi termit ja skaalaa ne uudelleen 0:n ja 1:n välille.

Lopuksi kerromme tuloksen (eli painot) arvolla (eli kaikilla sanoilla) vähentääksemme ei-olennaisten sanojen merkitystä ja keskittyäksemme vain tärkeimpiin sanoihin.

Monipäinen huomion lähtövektori lisätään alkuperäiseen sijaintisyötteen upotukseen. Tätä kutsutaan jäännösyhteydeksi/ohitusyhteydeksi. Jäännösyhteyden lähtö käy läpi kerroksen normalisoinnin. Normalisoitu jäännöslähtö johdetaan pistesuuntaisen syöttöverkon läpi jatkokäsittelyä varten.

Käsitteet, jotka sinun tulee tietää ennen Transformeriin siirtymistä

Maski on matriisi, joka on samankokoinen kuin huomiopisteet, jotka on täytetty arvoilla nollia ja negatiivisia äärettömiä.

Käsitteet, jotka sinun tulee tietää ennen Transformeriin siirtymistä

Syy maskiin on se, että kun otat maskattujen pisteiden softmaxin, negatiiviset äärettömyydet nollaantuvat, jolloin tuleville tokeneille ei jää huomiopisteitä.

Tämä kehottaa mallia olemaan keskittymättä näihin sanoihin.

Softmax-funktion tarkoitus on tarttua reaalilukuihin (positiiviset ja negatiiviset) ja muuntaa ne positiivisiksi luvuiksi, joiden summa on 1.

Käsitteet, jotka sinun tulee tietää ennen Transformeriin siirtymistä

Ravikumar Naduvin on kiireinen rakentamaan ja ymmärtämään NLP-tehtäviä PyTorchin avulla.

Alkuperäinen. Postitettu luvalla.

Lisää tästä aiheesta

SEO-pohjainen sisällön ja PR-jakelu. Vahvista jo tänään.
Platoblockchain. Web3 Metaverse Intelligence. Tietoa laajennettu. Pääsy tästä.
Lähde: https://www.kdnuggets.com/2023/01/concepts-know-getting-transformer.html?utm_source=rss&utm_medium=rss&utm_campaign=concepts-you-should-know-before-getting-into-transformer

Aikaleima: Tammikuu 13, 2023

Lisää aiheesta KDnuggets

Ajatusketjun kehotusten voiman purkaminen suurissa kielimalleissa - KDnuggets

Ajatusketjun kehotusten voiman purkaminen suurissa kielimalleissa – KDnuggets

Lähde klusteri:

Lähdesolmu: 2161254

Aikaleima: Heinäkuu 6, 2023

Tällä viikolla tekoälyssä 18. elokuuta: OpenAI taloudellisissa vaikeuksissa • Vakaus AI ilmoittaa StableCode - KDnuggets

Tällä viikolla tekoälyssä, 18. elokuuta: OpenAI taloudellisissa vaikeuksissa • Vakaus AI ilmoittaa StableCode – KDnuggets

Lähde klusteri:

Lähdesolmu: 2220508

Aikaleima: Elokuu 18, 2023

Koneoppimisalgoritmin täydellinen käyttöönotto reaaliaikaisessa tuotantoympäristössä

Lähde klusteri:

Lähdesolmu: 1882819

Aikaleima: Jan 11, 2022

5 parasta tekoälypodcastia, joita et voi missata vuonna 2024 - KDnuggets

5 parasta tekoälypodcastia, joita et voi missata vuonna 2024 – KDnuggets

Lähde klusteri:

Lähdesolmu: 2464728

Aikaleima: Helmikuu 1, 2024

20 Python -pakettia, joita tarvitset koneoppimiseen ja tietojenkäsittelyyn

Lähde klusteri:

Lähdesolmu: 1877931

Aikaleima: Lokakuu 14, 2021

Kehittyneet ominaisuuksien valintatekniikat koneoppimismalleille - KDnuggets

Kehittyneet ominaisuuksien valintatekniikat koneoppimismalleille – KDnuggets

Lähde klusteri:

Lähdesolmu: 2122813

Aikaleima: Kesäkuu 6, 2023

Vedä ja pudota -käyttöliittymä LLM-virtausten rakentamiseen: Flowise AI – KDnuggets

Lähde klusteri:

Lähdesolmu: 2181051

Aikaleima: Heinäkuu 21, 2023

Mitä kaikki irtisanomiset tekniikassa ovat?

Mitä kaikki irtisanomiset tekniikassa ovat?

Lähde klusteri:

Lähdesolmu: 1966177

Aikaleima: Helmikuu 16, 2023

Suosituimmat viestit 14.-20. elokuuta: ChatGPT:n käyttäminen tekstin muuntamiseen PowerPoint-esitykseksi - KDnuggets

Suosituimmat viestit 14.-20. elokuuta: ChatGPT:n käyttäminen tekstin muuntamiseen PowerPoint-esitykseksi – KDnuggets

Lähde klusteri:

Lähdesolmu: 2232143

Aikaleima: Elokuu 24, 2023

Kuinka merkitä aikasarjat tehokkaasti - ja tehostaa tekoälyäsi

Lähde klusteri:

Lähdesolmu: 1875261

Aikaleima: Syyskuu 20, 2021

AgentGPT: autonomiset AI-agentit selaimessasi – KDnuggets

Lähde klusteri:

Lähdesolmu: 2117104

Aikaleima: Kesäkuu 1, 2023

Parhaat Python-työkalut luovien tekoälysovellusten luomiseen - Huijauslehti - KDnuggets

Parhaat Python-työkalut luovien tekoälysovellusten luomiseen - Huijauslehti – KDnuggets

Lähde klusteri:

Lähdesolmu: 2209097

Aikaleima: Elokuu 10, 2023