Fogalmak, amelyeket ismernie kell, mielőtt belevágna a Transformersbe

KDnuggets

Fogalmak, amelyeket ismernie kell, mielőtt belevágna a Transformersbe

Big adatokIdőbélyeg: 13. január 2023. 12:00

Forrás csomópont: 1894868

Újra kiadta Platón

Követő: 0

A neurális hálózatok a számokon keresztül tanulnak, így minden szó vektorokra lesz leképezve egy adott szó megjelenítésére. A beágyazási réteg egy keresőtáblázatnak tekinthető, amely tárolja a szóbeágyazásokat, és indexek segítségével visszakeresi azokat.

Fogalmak, amelyeket tudnia kell, mielőtt belevág a Transformerbe

Az azonos jelentésű szavak közel állnak egymáshoz az euklideszi távolság/koszinusz hasonlóság szempontjából. Például az alábbi szóábrázolásban a „szombat”, „vasárnap” és a „hétfő” ugyanazon fogalomhoz kapcsolódik, így láthatjuk, hogy a szavak hasonlóak.

Fogalmak, amelyeket tudnia kell, mielőtt belevág a Transformerbe

A szó helyzetének meghatározása, Miért kell meghatároznunk a szó pozícióját? Mivel a transzformátor kódolónak nincs ismétlődése, mint az ismétlődő neurális hálózatoknak, a bemeneti beágyazásokhoz hozzá kell adnunk néhány információt a pozíciókról. Ez pozíciókódolással történik. A cikk szerzői a következő függvényeket használták egy szó helyzetének modellezésére.

Fogalmak, amelyeket tudnia kell, mielőtt belevág a Transformerbe

Megpróbáljuk elmagyarázni a pozicionális kódolást.

Fogalmak, amelyeket tudnia kell, mielőtt belevág a Transformerbe

Itt a „poz” a „szó” pozíciójára utal a sorozatban. P0 az első szó pozícióbeágyazására utal; A „d” a szó/token beágyazás méretét jelenti. Ebben a példában d=5. Végül az „i” a beágyazás mind az 5 egyedi dimenziójára vonatkozik (azaz 0, 1,2,3,4)

ha az „i” változó a fenti egyenletben, akkor egy csomó változó frekvenciájú görbét kapunk. A pozícióbeágyazási értékek leolvasása különböző frekvenciákhoz képest, különböző értékek megadása különböző beágyazási méreteknél P0 és P4 esetén.

Fogalmak, amelyeket tudnia kell, mielőtt belevág a Transformerbe

Ebben lekérdezés, Q vektorszót jelöl, a kulcsok K az összes többi szó a mondatban, és V érték a szó vektorát jelenti.

A figyelem célja a kulcskifejezés fontosságának kiszámítása az azonos személyhez/dologhoz vagy fogalomhoz kapcsolódó lekérdezési kifejezéshez képest.

Esetünkben V egyenlő Q-val.

A figyelemmechanizmus megadja számunkra a szó fontosságát a mondatban.

Fogalmak, amelyeket tudnia kell, mielőtt belevág a Transformerbe

Amikor kiszámítjuk a normalizált pontszorzatot a lekérdezés és a kulcsok között, akkor egy tenzort kapunk, amely az egymás szavának relatív fontosságát jelzi a lekérdezés szempontjából.

Fogalmak, amelyeket tudnia kell, mielőtt belevág a Transformerbe

A Q és KT közötti pontszorzat kiszámításakor megpróbáljuk megbecsülni a vektorok (azaz a lekérdezés és a kulcsok közötti szavak) igazítását, és súlyt adunk vissza a mondat minden szavára.

Ezután normalizáljuk az eredményt d_k négyzetével, és a softmax függvény szabályosítja a tagokat, és átskálázza őket 0 és 1 közé.

Végül megszorozzuk az eredményt (azaz a súlyokat) az értékkel (azaz az összes szóval), hogy csökkentsük a nem releváns szavak jelentőségét, és csak a legfontosabb szavakra koncentráljunk.

A többfejű figyelemkimeneti vektor hozzáadódik az eredeti pozíciós bemeneti beágyazáshoz. Ezt hívják maradék kapcsolatnak/kihagyó kapcsolatnak. A maradék kapcsolat kimenete rétegnormalizáláson megy keresztül. A normalizált maradék kimenetet egy pontszerű előrecsatoló hálózaton vezetik át további feldolgozás céljából.

Fogalmak, amelyeket tudnia kell, mielőtt belevág a Transformerbe

A maszk egy mátrix, amely akkora, mint a 0-k és negatív végtelen értékekkel megtöltött figyelempontszámok.

Fogalmak, amelyeket tudnia kell, mielőtt belevág a Transformerbe

A maszk oka az, hogy ha egyszer felveszi a maszkolt pontszámok softmax-ját, a negatív végtelen nulla lesz, így nulla figyelempont marad a jövőbeli tokeneknél.

Ez arra utasítja a modellt, hogy ne összpontosítson ezekre a szavakra.

A softmax függvény célja valós számok (pozitív és negatív) megragadása és pozitív számokká alakítása, amelyek összege 1.

Fogalmak, amelyeket tudnia kell, mielőtt belevág a Transformerbe

Ravikumar Naduvin elfoglalt az NLP-feladatok felépítésével és megértésével a PyTorch használatával.

eredeti. Engedéllyel újra közzétéve.

Bővebben erről a témáról

SEO által támogatott tartalom és PR terjesztés. Erősödjön még ma.
Platoblockchain. Web3 metaverzum intelligencia. Felerősített tudás. Hozzáférés itt.
Forrás: https://www.kdnuggets.com/2023/01/concepts-know-getting-transformer.html?utm_source=rss&utm_medium=rss&utm_campaign=concepts-you-should-know-before-getting-into-transformer

Időbélyeg: Január 13, 2023

Még több KDnuggets

A StableCode bemutatása: Új horizont az AI által támogatott kódolásban – KDnuggets

A StableCode bemutatása: Új horizont az AI-asszisztált kódolásban – KDnuggets

Forrás klaszter:

Forrás csomópont: 2210651

Időbélyeg: 9. augusztus 2023.

Hogyan lehet áttérni az adattudományra más háttérből?

Forrás klaszter:

Forrás csomópont: 2082846

Időbélyeg: May 4, 2023

Felmérés: A gépi tanulási projektek telepítése továbbra is rutinszerűen sikertelen – KDnuggets

Felmérés: A gépi tanulási projekteket még mindig nem sikerül bevezetni – KDnuggets

Forrás klaszter:

Forrás csomópont: 2439691

Időbélyeg: 8. január 2024.

PASS Data Community Summit – Ingyenes online konferencia adatszakértőknek

Forrás klaszter:

Forrás csomópont: 1188562

Időbélyeg: 11. október 2021.

Hagyja abba ezt a ChatGPT-n, és előzze meg a felhasználók 99%-át

Hagyja abba ezt a ChatGPT-n, és előzze meg a felhasználók 99%-át

Forrás klaszter:

Forrás csomópont: 2088207

Időbélyeg: May 9, 2023

5 tipp a Clean R kód írásához

Forrás klaszter:

Forrás csomópont: 1015325

Időbélyeg: 9. augusztus 2021.

Lineáris programozás 101 adattudósoknak

Lineáris programozás 101 adattudósoknak

Forrás klaszter:

Forrás csomópont: 1951697

Időbélyeg: 8. február 2023.

Értelmezhető neurális hálózatok PyTorch segítségével

Forrás klaszter:

Forrás csomópont: 1583660

Időbélyeg: 11. január 2022.

A mesterséges intelligencia vezetőjének felemelkedése – KDnuggets

Az AI vezető felemelkedése – KDnuggets

Forrás klaszter:

Forrás csomópont: 2536075

Időbélyeg: 5. április 2024.

Szöveg-2 videó létrehozása: lépésről lépésre útmutató - KDnuggets

Szöveg-2 videó létrehozása: Lépésről lépésre útmutató – KDnuggets

Forrás klaszter:

Forrás csomópont: 2218808

Időbélyeg: 17. augusztus 2023.

A Microsoft Excel és a Word automatizálása Python használatával

Forrás klaszter:

Forrás csomópont: 1057126

Időbélyeg: 24. augusztus 2021.

Mi az a klaszterezés és hogyan működik?

Forrás klaszter:

Forrás csomópont: 1181186

Időbélyeg: 14. október 2021.