Zero-shot Learning, Açıklandı

Plato tarafından yeniden yayınlandı

İzleyiciler: 0

Zero-shot Learning, Açıklandı
bruce warrington Unsplash aracılığıyla

Genel olarak makine öğrenimi modellerinin daha akıllı hale gelmesinin nedeni, benzer iki nesneyi ayırt etmelerine yardımcı olmak için etiketli verileri kullanmaya olan bağımlılıklarıdır.

Ancak, bu etiketli veri kümeleri olmadan, en etkili ve güvenilir makine öğrenimi modelini oluştururken büyük engellerle karşılaşırsınız. Bir modelin eğitim aşamasında etiketlenmiş veri kümeleri önemlidir.

Derin öğrenme, denetimli öğrenmeyi kullanarak Bilgisayar görüşü gibi görevleri çözmek için yaygın olarak kullanılmaktadır. Ancak, hayattaki birçok şeyde olduğu gibi, kısıtlamalarla birlikte gelir. Denetimli sınıflandırma, sağlam bir model oluşturmak için yüksek miktarda ve kalitede etiketlenmiş eğitim verisi gerektirir. Bu, sınıflandırma modelinin görünmeyen sınıfları işleyemeyeceği anlamına gelir.

Ve bir derin öğrenme modelini eğitmenin ne kadar bilgi işlem gücü, yeniden eğitim, zaman ve para gerektirdiğini hepimiz biliyoruz.

Ancak bir model, eğitim verilerini kullanmadan iki nesneyi ayırt edebilir mi? Evet, buna sıfır vuruşlu öğrenme denir. Sıfır vuruşlu öğrenme, bir modelin herhangi bir eğitim örneği almadan veya kullanmadan bir görevi tamamlayabilme yeteneğidir.

İnsanlar doğal olarak fazla çaba harcamadan sıfır vuruşla öğrenme yeteneğine sahiptir. Beynimiz zaten sözlükler depolar ve mevcut bilgi tabanımız sayesinde nesneleri fiziksel özelliklerine bakarak ayırt etmemizi sağlar. Nesneler arasındaki benzerlikleri ve farklılıkları görmek ve aralarındaki bağlantıyı bulmak için bu bilgi tabanını kullanabiliriz.

Örneğin hayvan türleri üzerine bir sınıflandırma modeli oluşturmaya çalıştığımızı varsayalım. Buna göre BizimDünyamızInData2.13 yılında hesaplanan 2021 milyon tür vardı. Dolayısıyla hayvan türleri için en etkili sınıflandırma modelini oluşturmak istiyorsak 2.13 milyon farklı sınıfa ihtiyacımız olacak. Ayrıca çok fazla veriye ihtiyaç duyulacaktır. Yüksek nicelikli ve kaliteli verilere rastlamak zordur.

Peki sıfır vuruşlu öğrenme bu sorunu nasıl çözüyor?

Sıfır vuruşlu öğrenme, modelin eğitim verilerini ve sınıfları nasıl sınıflandıracağını öğrenmesini gerektirmediğinden, modelin etiketli verilere olan ihtiyacına daha az güvenmemizi sağlar.

Aşağıda, sıfır vuruşlu öğrenmeye devam etmek için verilerinizin nelerden oluşması gerektiği açıklanmaktadır.

Görülen Sınıflar

Bu, daha önce bir modeli eğitmek için kullanılmış olan veri sınıflarından oluşur.

Görünmeyen Sınıflar

Bu, bir modeli eğitmek için KULLANILMAYAN veri sınıflarından oluşur ve yeni sıfır vuruşlu öğrenme modeli genelleştirilir.

Yardımcı Bilgi

Görünmeyen sınıflardaki veriler etiketlenmediğinden sıfır vuruşlu öğrenme, öğrenmek ve korelasyonları, bağlantıları ve özellikleri bulmak için yardımcı bilgilere ihtiyaç duyacaktır. Bu, kelime yerleştirmeleri, açıklamalar ve anlamsal bilgiler şeklinde olabilir.

Sıfır Atışlı Öğrenme Yöntemleri

Sıfır vuruşlu öğrenme genellikle şu durumlarda kullanılır:

Sınıflandırıcı tabanlı yöntemler
Örnek tabanlı yöntemler

Stajlar

Sıfır vuruşlu öğrenme, etiketli verileri kullanarak eğitim vermeyen sınıflar için modeller oluşturmak için kullanılır, bu nedenle şu iki aşamayı gerektirir:

1. Eğitim

Eğitim aşaması, verilerin nitelikleri hakkında mümkün olduğu kadar çok bilgi toplamaya çalışan öğrenme yönteminin sürecidir. Bunu öğrenme aşaması olarak görebiliriz.

2. Çıkarım

Çıkarım aşamasında, eğitim aşamasından öğrenilen tüm bilgiler, örnekleri yeni bir sınıf kümesine göre sınıflandırmak için uygulanır ve kullanılır. Bunu tahmin yapma aşaması olarak görebiliriz.

Nasıl Çalışır?

Görülen sınıflardan gelen bilgi, yüksek boyutlu bir vektör uzayında görünmeyen sınıflara aktarılacak; buna semantik uzay denir. Örneğin, görüntü sınıflandırmasında, görüntüyle birlikte anlamsal alan iki aşamadan geçer:

1. Eklem gömme alanı

Anlamsal vektörlerin ve görsel özelliğin vektörlerinin yansıtıldığı yer burasıdır.

2. En yüksek benzerlik

Bu, özelliklerin görünmeyen bir sınıfınkilerle eşleştirildiği yerdir.

İki aşamalı süreci (eğitim ve çıkarım) anlamaya yardımcı olmak için, bunları görüntü sınıflandırmasının kullanımına uygulayalım.

Eğitim

Zero-shot Learning, Açıklandı
Jari Hytönen Unsplash aracılığıyla

Bir insan olarak yukarıdaki görselin sağındaki yazıyı okursanız kahverengi bir sepette 4 yavru kedi olduğunu hemen varsayarsınız. Ama diyelim ki 'yavru kedi'nin ne olduğu hakkında hiçbir fikriniz yok. İçinde 'yavru kedi' denilen 4 şeyin olduğu kahverengi bir sepet olduğunu varsayacaksınız. Bir 'yavru kediye' benzeyen bir şey içeren daha fazla resimle karşılaştığınızda, bir 'yavru kediyi' diğer hayvanlardan ayırt edebileceksiniz.

kullanınca böyle oluyor Karşıt Dil-Görüntü Ön Eğitimi Görüntü sınıflandırmasında sıfır adımlı öğrenme için OpenAI tarafından (CLIP). Yardımcı bilgi olarak bilinir.

'Pekala, bu sadece etiketlenmiş veriler' diye düşünüyor olabilirsiniz. Neden böyle düşündüğünü anlıyorum ama öyle değiller. Yardımcı bilgiler, verilerin etiketleri değildir, eğitim aşamasında modelin öğrenmesine yardımcı olacak bir denetim şeklidir.

Sıfır vuruşlu bir öğrenme modeli, yeterli miktarda görüntü-metin eşleşmesi gördüğünde, ifadeleri ve bunların görüntülerdeki belirli kalıplarla nasıl ilişkili olduğunu ayırt edebilecek ve anlayabilecektir. CLIP tekniği 'karşıtlıklı öğrenme' kullanılarak, sıfır vuruşlu öğrenme modeli, sınıflandırma görevlerinde tahminler yapabilmek için iyi bir bilgi tabanı biriktirebilmiştir.

Bu, eğitim örnekleri yığınının (görüntü, metin) doğru eşleşmelerini tahmin etmek için bir görüntü kodlayıcı ve bir metin kodlayıcıyı birlikte eğittikleri CLIP yaklaşımının bir özetidir. Lütfen aşağıdaki resme bakın:

Zero-shot Learning, Açıklandı
Doğal Dil Denetiminden Aktarılabilir Görsel Modelleri Öğrenmek

sonuç

Model eğitim aşamasından geçtikten sonra görüntü-metin eşleştirme konusunda iyi bir bilgi tabanına sahip olur ve artık tahminlerde bulunmak için kullanılabilir. Ancak doğrudan tahminlerde bulunmaya başlamadan önce, modelin çıktısını alabileceği tüm olası etiketlerin bir listesini oluşturarak sınıflandırma görevini ayarlamamız gerekir.

Örneğin, hayvan türleri üzerindeki görüntü sınıflandırma görevine bağlı kalarak, tüm hayvan türlerinin bir listesine ihtiyacımız olacak. Bu etiketlerin her biri kodlanacak, T? T'ye mi? eğitim aşamasında oluşan önceden eğitilmiş metin kodlayıcıyı kullanarak.

Etiketler kodlandıktan sonra, önceden eğitilmiş görüntü kodlayıcı aracılığıyla görüntüleri girebiliriz. Görüntü kodlaması ile her bir metin etiketi kodlaması arasındaki benzerlikleri hesaplamak için mesafe metriği kosinüs benzerliğini kullanacağız.

Görüntünün sınıflandırılması, görüntüye en çok benzeyen etikete göre yapılır. Ve bu, özellikle görüntü sınıflandırmada, sıfır vuruşlu öğrenmenin nasıl başarıldığıdır.

Veri Kıtlığı

Daha önce de belirtildiği gibi, yüksek miktarda ve kaliteli veriye ulaşmak zordur. Halihazırda sıfır vuruşlu öğrenme yeteneğine sahip olan insanların aksine, makineler öğrenmek ve ardından doğal olarak meydana gelebilecek değişikliklere uyum sağlayabilmek için girdi etiketli verilere ihtiyaç duyar.

Hayvan türleri örneğine bakarsak, o kadar çok vardı ki. Ve farklı alanlarda kategori sayısı artmaya devam ettikçe, açıklamalı verilerin toplanmasına ayak uydurmak çok zaman alacaktır.

Bu nedenle, sıfır vuruşlu öğrenme bizim için daha değerli hale geldi. Giderek daha fazla araştırmacı, mevcut veri eksikliğini telafi etmek için otomatik öznitelik tanıma ile ilgileniyor.

Veri Etiketleme

Sıfır vuruşlu öğrenmenin bir başka yararı da veri etiketleme özellikleridir. Veri etiketleme, emek yoğun ve çok sıkıcı olabilir ve bu nedenle işlem sırasında hatalara yol açabilir. Veri etiketleme, son derece pahalı ve zaman alan bir biyomedikal veri kümesi üzerinde çalışan tıp uzmanları gibi uzmanlar gerektirir.

Sıfır vuruşlu öğrenme, yukarıdaki veri sınırlamaları nedeniyle daha popüler hale geliyor. Yetenekleriyle ilgileniyorsanız okumanızı tavsiye edeceğim birkaç makale var:

Nişa Arya Veri Bilimcisi ve Serbest Teknik Yazardır. Özellikle Veri Bilimi kariyer tavsiyesi veya öğreticiler ve Veri Bilimi hakkında teoriye dayalı bilgiler sağlamakla ilgilenmektedir. Ayrıca Yapay Zekanın insan yaşamının uzun ömürlü olmasına fayda sağladığı/yararlayabileceği farklı yolları keşfetmek istiyor. Başkalarına rehberlik ederken teknik bilgisini ve yazma becerilerini genişletmeye çalışan hevesli bir öğrenci.