Transformatörlere Başlamadan Önce Bilmeniz Gereken Kavramlar

KDNuggets

Transformatörlere Başlamadan Önce Bilmeniz Gereken Kavramlar

büyük VeriZaman Damgası: 13 Ocak 2023 12:00

Kaynak Düğüm: 1894868

Plato tarafından yeniden yayınlandı

İzleyiciler: 0

Sinir ağları sayılar aracılığıyla öğrenir, böylece her kelime belirli bir kelimeyi temsil edecek vektörlerle eşleştirilir. Gömme katmanı, sözcük yerleştirmelerini saklayan ve bunları dizinler kullanarak alan bir arama tablosu olarak düşünülebilir.

Trafoya Başlamadan Önce Bilmeniz Gereken Kavramlar

Aynı anlama gelen kelimeler öklid uzaklığı/kosinüs benzerliği açısından birbirine yakın olacaktır. örneğin aşağıdaki kelime gösteriminde “Cumartesi”, “Pazar” ve “Pazartesi” aynı kavramla ilişkilendirildiğinden kelimelerin benzer sonuçlandığını görebiliriz.

Trafoya Başlamadan Önce Bilmeniz Gereken Kavramlar

Kelimenin konumunu belirleme, Neden kelimenin konumunu belirlememiz gerekiyor? Transformatör kodlayıcının tekrarlayan sinir ağları gibi yinelemesi olmadığından, giriş yerleştirmelerine konumlar hakkında bazı bilgiler eklememiz gerekir. Bu konumsal kodlama kullanılarak yapılır. Makalenin yazarları bir kelimenin konumunu modellemek için aşağıdaki işlevleri kullandılar.

Trafoya Başlamadan Önce Bilmeniz Gereken Kavramlar

Konumsal Kodlamayı açıklamaya çalışacağız.

Trafoya Başlamadan Önce Bilmeniz Gereken Kavramlar

Burada “pos”, “kelimenin” dizideki konumunu ifade etmektedir. P0, ilk kelimenin gömülü konumunu ifade eder; “d”, gömülen kelimenin/belirtecin boyutu anlamına gelir. Bu örnekte d=5. Son olarak “i” yerleştirmenin 5 ayrı boyutunun her birini ifade eder (yani 0, 1,2,3,4)

Yukarıdaki denklemde "i" değişirse, değişen frekanslara sahip bir grup eğri elde edersiniz. Pozisyon gömme değerlerinin farklı frekanslara karşı okunması, P0 ve P4 için farklı gömme boyutlarında farklı değerler verilmesi.

Trafoya Başlamadan Önce Bilmeniz Gereken Kavramlar

Bu sorgu, S bir vektör kelimesini temsil eder, tuşları K cümledeki tüm diğer kelimeler ve değer V kelimenin vektörünü temsil eder.

Dikkatin amacı aynı kişi/şey veya kavrama ilişkin sorgu terimine göre anahtar terimin önemini hesaplamaktır.

Bizim durumumuzda V, Q'ya eşittir.

Dikkat mekanizması bize cümledeki kelimenin önemini verir.

Trafoya Başlamadan Önce Bilmeniz Gereken Kavramlar

Sorgu ile anahtarlar arasındaki normalleştirilmiş nokta çarpımı hesapladığımızda, her bir kelimenin sorgu için göreli önemini temsil eden bir tensör elde ederiz.

Trafoya Başlamadan Önce Bilmeniz Gereken Kavramlar

Q ve KT arasındaki nokta çarpımı hesaplarken, vektörlerin (yani sorgu ve anahtarlar arasındaki kelimelerin) nasıl hizalandığını tahmin etmeye çalışırız ve cümledeki her kelime için bir ağırlık veririz.

Daha sonra d_k'nin sonucunun karesini normalleştiririz ve softmax işlevi terimleri düzenler ve 0 ile 1 arasında yeniden ölçeklendirir.

Son olarak, alakasız kelimelerin önemini azaltmak ve yalnızca en önemli kelimelere odaklanmak için sonucu (yani ağırlıkları) değerle (yani tüm kelimelerle) çarpıyoruz.

Çok başlı dikkat çıkış vektörü, orijinal konumsal girdi yerleştirmeye eklenir. Buna artık bağlantı/atlama bağlantısı denir. Artık bağlantının çıkışı katman normalleştirmesinden geçer. Normalleştirilmiş artık çıktı, daha sonraki işlemler için noktasal ileri beslemeli bir ağdan geçirilir.

Trafoya Başlamadan Önce Bilmeniz Gereken Kavramlar

Maske, 0'lar ve negatif sonsuzluk değerleriyle dolu, dikkat puanlarıyla aynı büyüklükte bir matristir.

Trafoya Başlamadan Önce Bilmeniz Gereken Kavramlar

Maskenin nedeni, maskelenmiş puanların softmax'ını aldığınızda, negatif sonsuzlukların sıfır alması ve gelecekteki belirteçler için sıfır dikkat puanı bırakmasıdır.

Bu, modele bu kelimelere odaklanmamasını söyler.

Softmax fonksiyonunun amacı gerçek sayıları (pozitif ve negatif) alıp bunları toplamı 1 olan pozitif sayılara dönüştürmektir.

Trafoya Başlamadan Önce Bilmeniz Gereken Kavramlar

Ravikumar Naduvin PyTorch'u kullanarak NLP görevlerini oluşturmak ve anlamakla meşgul.

orijinal. İzinle yeniden yayınlandı.

Bu Konu hakkında daha fazlası

SEO Destekli İçerik ve Halkla İlişkiler Dağıtımı. Bugün Gücünüzü Artırın.
Plato blok zinciri. Web3 Metaverse Zekası. Bilgi Güçlendirildi. Buradan Erişin.
Kaynak: https://www.kdnuggets.com/2023/01/concepts-know-getting-transformer.html?utm_source=rss&utm_medium=rss&utm_campaign=concepts-you-should-know-before-getting-into-transformer

Zaman Damgası: Ocak 13, 2023

Den fazla KDNuggets

Öğrencilerin Veri Bilimi Özgeçmişinde Eksik Olduğu 7 Şey – KDnuggets

Kaynak Küme:

Kaynak Düğüm: 2542010

Zaman Damgası: Nisan 11, 2024

Teknoloji Endüstrisinde Uzmanlaşmaya Giden Nihai Yol Haritası - KDnuggets

Teknoloji Sektöründe Uzmanlaşmaya Giden Nihai Yol Haritası – KDnuggets

Kaynak Küme:

Kaynak Düğüm: 2540850

Zaman Damgası: Nisan 10, 2024

Herhangi Bir Ücretsiz Veri Bilimi Kursuna Katılmadan Önce Bunu Okuyun - KDnuggets

Herhangi Bir Ücretsiz Veri Bilimi Kursuna Almadan Önce Bunu Okuyun – KDnuggets

Kaynak Küme:

Kaynak Düğüm: 2437399

Zaman Damgası: Jan 11, 2024

Evde Yetiştirilen Büyük Dil Modelleri Örneği - KDnuggets

Evde Yetiştirilen Büyük Dil Modelleri Örneği – KDnuggets

Kaynak Küme:

Kaynak Düğüm: 2539953

Zaman Damgası: Nisan 9, 2024

Veri Bilimi Kariyerimde 3 Yılda Öğrendiğim En Önemli 3 Ders

Kaynak Küme:

Kaynak Düğüm: 1083656

Zaman Damgası: Eylül 13, 2021

5 Gelir Akışı Oluşturmak için Veri Bilimi Becerilerinizi Kullanın

Kaynak Küme:

Kaynak Düğüm: 2018181

Zaman Damgası: Mar 14, 2023

Önde gelen deney uzmanı Ronny Kohavi'den (eski Amazon, Airbnb, Microsoft) güvenilir A/B testlerini nasıl tasarlayacağınızı, ölçeceğinizi ve uygulayacağınızı öğrenin.

Önde gelen deney uzmanı Ronny Kohavi'den (eski Amazon, Airbnb, Microsoft) güvenilir A/B testlerini nasıl tasarlayacağınızı, ölçeceğinizi ve uygulayacağınızı öğrenin.

Kaynak Küme:

Kaynak Düğüm: 1927772

Zaman Damgası: Jan 24, 2023

Veri Bilimi, Veri Mühendisliği, Makine Öğrenimi, MLOps ve Üretken Yapay Zekada Uzmanlaşmak için 25 Ücretsiz Kurs - KDnuggets

Veri Bilimi, Veri Mühendisliği, Makine Öğrenimi, MLOps ve Üretken Yapay Zekada Uzmanlaşmak için 25 Ücretsiz Kurs – KDnuggets

Kaynak Küme:

Kaynak Düğüm: 2416182

Zaman Damgası: Aralık 27, 2023

Kaggle Yarışmaları Gerçek Dünya Sorunları İçin Yararlı Mıdır? - KDnuggets

Kaggle Yarışmaları Gerçek Dünya Sorunları İçin Yararlı Mıdır? – KDnuggets

Kaynak Küme:

Kaynak Düğüm: 2324253

Zaman Damgası: Ekim 12, 2023

Veri Mühendisliğinde Uzmanlaşmak İçin 7 Adım - KDnuggets

Veri Mühendisliğinde Uzmanlaşmanın 7 Adımı – KDnuggets

Kaynak Küme:

Kaynak Düğüm: 2543152

Zaman Damgası: Nisan 12, 2024

StableCode'u Tanıtıyoruz: Yapay Zeka Destekli Kodlamada Yeni Bir Ufuk - KDnuggets

StableCode Tanıtılıyor: Yapay Zeka Destekli Kodlamada Yeni Bir Ufuk – KDnuggets

Kaynak Küme:

Kaynak Düğüm: 2210651

Zaman Damgası: Ağustos 9, 2023

Veri Biliminde Uzaktan Çalışma: Artıları ve Eksileri - KDnuggets

Veri Biliminde Uzaktan Çalışma: Artıları ve Eksileri – KDnuggets

Kaynak Küme:

Kaynak Düğüm: 2397138

Zaman Damgası: Kasım 24, 2023