Yapay zekaya sağduyu öğretebilir misiniz?

Kaynak Düğüm: 990012

Transform 2021'deki tüm oturumlar artık isteğe bağlı olarak sunulmaktadır. İzle şimdi.


İnsan bebekleri daha ilk kelimelerini söylemeden önce nesneler ve insanlar hakkında zihinsel modeller geliştirirler. Bu, biz insanların sosyal olarak yaşamayı ve birbirimizle işbirliği yapmayı (veya rekabet etmeyi) öğrenmesine olanak tanıyan temel yeteneklerden biridir. Ancak yapay zeka için en temel davranışsal muhakeme görevleri bile zorlu olmaya devam ediyor.

Gelişmiş derin öğrenme modelleri görüntülerdeki insanları ve nesneleri tespit etmek gibi karmaşık görevleri bazen insanlardan daha iyi yapabiliyor. Ancak görüntülerin görsel özelliklerinin ötesine geçmekte ve diğer aktörlerin ne yaptığı ya da neyi başarmak istediği hakkında çıkarımlar yapmakta zorlanıyorlar.

Bu boşluğu doldurmaya yardımcı olmak için IBM, Massachusetts Teknoloji Enstitüsü ve Harvard Üniversitesi'ndeki bilim insanları, yapay zeka modellerinin dünyayı gözlemleyerek ve anlamlandırarak çocuklar gibi akıl yürütme kapasitesini değerlendirmeye yardımcı olacak bir dizi test geliştirdi.

Yapay Zeka araştırmacıları, "İnsan bebekleri gibi, makine ajanlarının da sosyal etkileşimlere başarılı bir şekilde girebilmek için insan zihnini anlama konusunda yeterli kapasiteyi geliştirmesi kritik önem taşıyor" diye yazıyor. yeni kağıt AGENT adı verilen veri kümesini tanıtır.

Bu yılki Uluslararası Makine Öğrenimi Konferansı'nda (ICML) sunulan AGENT, yapay zeka sistemlerinin muhakeme yeteneklerini ölçmek için önemli bir kıyaslama sağlıyor.

Temsilci davranışını gözlemlemek ve tahmin etmek

Yapay zeka sistemlerinde sağduyuyu ve muhakemeyi test etmeye yönelik çok sayıda çalışma var. Birçoğu, ünlüler de dahil olmak üzere doğal dil anlayışına odaklanıyor. Turing Testi ve Winograd şemaları. Buna karşılık AGENT projesi, insanların konuşmaya başlamadan önce öğrendikleri muhakeme yeteneklerine odaklanıyor.

Dan Gutfreund, müdür, "Gelişim psikolojisi literatürünü takip ederek hedefimiz, bebeklerin dil öncesi aşamada (hayatlarının ilk 18 ayında) öğrendikleri sezgisel psikoloji ile ilgili belirli sağduyu yeteneklerini değerlendirmek için bir referans oluşturmaktır" dedi. MIT-IBM Watson Yapay Zeka Laboratuvarı'ndaki araştırmacı şunları söyledi: TechTalks.

Çocuklar olarak çevremizi gözlemleyerek nesneler ve etmenler arasındaki farkı anlatmayı öğreniriz. Olayların gelişmesini izledikçe sezgisel psikolojik beceriler geliştirir, diğer insanların eylemlerini gözlemleyerek hedeflerini tahmin eder ve zihnimizi düzeltmeye ve güncellemeye devam ederiz. Bütün bunları çok az talimatla veya hiç talimat olmadan öğreniyoruz.

AGENT (Eylem, Hedef, Verimlilik, Kısıtlama, Fayda) testinin arkasındaki fikir, AI sistemleri Bu temel beceriyi taklit edebildikleri, psikolojik muhakeme yeteneklerini geliştirebildikleri ve öğrendikleri temsillerin yeni durumlara ne kadar iyi genellenebildiği. Veri seti, bir aracının çeşitli nesnelerden birine doğru yolunu izlediğini gösteren kısa dizilerden oluşur. Diziler, yapay zeka ajanlarının eğitimi için tasarlanmış sanal bir 3 boyutlu ortam olan ThreeDWorld'de üretildi.

AGENT testi iki aşamada gerçekleşir. İlk olarak yapay zekaya, aracının davranışını gösteren bir veya iki dizi sunulur. Bu örnekler yapay zekaya sanal aracının tercihlerini tanıtmalıdır. Örneğin, bir aracı, yoluna çıkan engellere bakılmaksızın her zaman bir nesne türünü seçebilir veya türüne bakılmaksızın en yakın ve en erişilebilir nesneyi seçebilir.

Alışma aşamasından sonra yapay zekaya bir test dizisi gösterilir ve ajanın beklenen bir şekilde mi yoksa şaşırtıcı bir şekilde mi hareket ettiğini belirlemesi gerekir.

Toplamda 3,360 adet olan testler, çok basit davranışlardan (temsilci ortamdan bağımsız olarak tek tür nesneyi tercih eder) başlayarak daha karmaşık zorluklara (temsilci maliyet-ödül tahminini ortaya koyar, başarının zorluğunu tartar) kadar dört senaryo türünü kapsar. Alacağı ödüle karşılık bir gol). Yapay zeka aynı zamanda oyunculuk yapan temsilcinin eylem verimliliğini de dikkate almalıdır (örneğin, hiçbir engel olmadığında gereksiz atlamalar yapmamalıdır). Bazı zorluklarda, çevre hakkında akıl yürütmeyi zorlaştırmak için sahne kısmen kapatılmıştır.

Yapay bir ortamda gerçekçi senaryolar

Testlerin tasarımcıları, insanlara yönelik tümevarımsal önyargıları dahil etmiştir; bu, etmenlerin ve çevrenin, insanlar için rasyonel olabilecek kurallara göre yönetildiği anlamına gelir (örneğin, bir engeli atlamanın veya bir engele tırmanmanın maliyeti, engelin yüksekliğiyle birlikte artar). Bu karar, zorlukların daha gerçekçi ve değerlendirilmesinin daha kolay olmasına yardımcı olur. Araştırmacılar ayrıca bu tür önyargıların, insan davranışıyla daha uyumlu ve uyumlu olan ve insan meslektaşlarıyla işbirliği yapabilen yapay zeka sistemlerinin oluşturulmasına yardımcı olmak açısından da önemli olduğunu belirtiyor.

Yapay zeka araştırmacıları, Amazon Mechanical Turk aracılığıyla gönüllü insanlar üzerindeki zorlukları test etti. Bulgular, insanların alışma sıralarını gözlemleyerek ve test örneklerini değerlendirerek ortalama olarak zorlukların yüzde 91'ini çözebileceğini gösteriyor. Bu, insanların, etmenlerin nasıl karar verdiklerini anlamak için dünya ve insan/hayvan davranışları hakkındaki ön bilgilerini kullandıkları anlamına gelir (örneğin, diğer her şey eşit olduğunda, bir etmen, daha yüksek ödüle sahip nesneyi seçecektir).

Yapay zeka araştırmacıları, sorunların çözümünde akıllıca olmayan kısayolları önlemek için veri kümesinin boyutunu kasıtlı olarak sınırladı. Çok büyük bir veri kümesi göz önüne alındığında, bir makine öğrenimi modeli, aracı davranışı hakkında temel bilgileri elde etmeden doğru tahminler yapmayı öğrenebilir. “Sadece veri setimiz üzerinden sıfırdan eğitim işe yaramayacak. Bunun yerine, testleri geçmek için mimarilerdeki tümevarımsal önyargılar yoluyla ya da ek veriler üzerinde eğitim yoluyla ek bilgi edinmenin gerekli olduğunu öneriyoruz” diye yazıyor araştırmacılar.

Ancak araştırmacılar testlerde bazı kısayollar uyguladılar. AGENT veri seti, sahnenin her karesi için derinlik haritaları, segmentasyon haritaları ve nesne ve engellerin sınırlayıcı kutularını içerir. Sahneler görsel detaylar açısından da son derece sade ve sekiz ayrı renkten oluşuyor. Tüm bunlar, yapay zeka sistemlerinin olay yerindeki bilgiyi işlemesini ve sorunun akıl yürütme kısmına odaklanmasını kolaylaştırıyor.

Mevcut yapay zeka, AGENT zorluklarını çözüyor mu?

Araştırmacılar AGENT mücadelesini iki temel yapay zeka modeli üzerinde test etti. Bunlardan ilki, Bayesian Ters Planlama ve Temel Bilgi (BIPaCK), fizik simülasyonu ve planlamayı bütünleştiren üretken bir modeldir.

BIPaCK modeli

Yukarıda: BIPaCK modeli, ajanın yörüngesini tahmin etmek için planlayıcı ve fizik motorlarını kullanıyor

Bu model, veri kümesi tarafından sağlanan tam gerçek bilgiyi kullanır ve aracının yörüngesini tahmin etmek için bunu kendi fizik ve planlama motoruna besler. Araştırmacıların deneyleri, BIPaCK'in olay yeri hakkında tam bilgiye sahip olduğunda insanlarla aynı hatta daha iyi performans gösterebildiğini gösteriyor.

Bununla birlikte, gerçek dünyada, yapay zeka sistemlerinin tam olarak açıklamalı temel gerçek bilgilerine erişimi yoktur ve farklı arka planlara ve ışık koşullarına sahip nesneleri tespit etme gibi karmaşık bir görevi yerine getirmek zorundadır; bu, insanların ve hayvanların kolayca çözdüğü ancak bilgisayarlar için bir zorluk olmaya devam eden bir sorundur. görüş sistemleri.

Araştırmacılar makalelerinde BIPaCK'in "3 boyutlu durumun doğru bir şekilde yeniden yapılandırılmasını ve fiziksel dinamiklerin yerleşik bir modelini gerektirdiğini ve bunların gerçek dünya sahnelerinde mutlaka mevcut olmayacağını" kabul ediyorlar.

Araştırmacıların test ettiği ToMnet-G kod adlı ikinci model, Zihin Teorisi Sinir Ağının genişletilmiş bir versiyonudur (ToMnetbilim insanları tarafından önerilen DeepMind 2018'de. ToMnet-G, nesneler, engeller ve aracının konumu dahil olmak üzere sahnelerin durumunu kodlamak için grafik sinir ağlarını kullanıyor. Daha sonra bu kodlamaları besler uzun kısa süreli hafıza ağları (LSTM), kare dizisi boyunca aracının yörüngesini izlemek için. Model, aracının test videolarındaki davranışını tahmin etmek ve bunları beklenen veya şaşırtıcı olarak derecelendirmek için tanıtım videolarından çıkardığı temsilleri kullanır.

ToMnet-G modeli

Yukarıda: ToMnet-G modeli, sahne temsillerini yerleştirmek ve aracı davranışını tahmin etmek için grafik sinir ağlarını ve LSTM'leri kullanıyor

ToMnet-G'nin avantajı, BIPaCK'in önceden tasarlanmış fizik ve sağduyu bilgisini gerektirmemesidir. Her şeyi videolardan ve diğer veri kümelerindeki önceki eğitimlerden öğrenir. Öte yandan, ToMnet-G sıklıkla yanlış temsilleri öğrenir ve davranışını yeni senaryolara veya sınırlı tanıdık bilgiye sahip olduğunda genelleştiremez.

Araştırmacılar makalelerinde şunu gözlemliyor: "Çok sayıda yerleşik öncelik olmadan ToMnet-G, benzer senaryolar üzerinde eğitilip test edildiğinde umut verici sonuçlar gösteriyor, ancak yine de hem senaryolar içinde hem de senaryolar arasında güçlü bir genelleme kapasitesine sahip değil."

İki model arasındaki zıtlık, insanların herhangi bir talimat olmadan öğrendiği en basit görevlerin zorluklarını vurguluyor.

Gutfreund, "Kıyaslamamızın, tasarım gereği, her seferinde sağduyunun belirli bir yönünü ele alan çok basit sentetik senaryoları tasvir ettiğini unutmamalıyız" dedi. "Gerçek dünyada insanlar, fizik, psikoloji, dil ve daha fazlasıyla ilgili sağduyunun birçok yönünün eş zamanlı olarak rol oynadığı karmaşık sahneleri çok hızlı bir şekilde ayrıştırabiliyor. Yapay zeka modelleri hâlâ buna yakın bir şey yapmaktan çok uzak.”

Sağduyu ve yapay zekanın geleceği

Gutfreund, "Dar yapay zekadan geniş yapay zekaya giden yolun sağduyuya sahip modelleri içermesi gerektiğine inanıyoruz" dedi. "Sağduyu yetenekleri, dünyayı anlama ve onunla etkileşimde bulunma konusunda önemli yapı taşlarıdır ve yeni yeteneklerin edinilmesini kolaylaştırabilir."

Pek çok bilim insanı, sağduyu ve akıl yürütmenin, mevcut yapay zeka sistemlerinin karşılaştığı, geniş hacimli eğitim verilerine ihtiyaç duymaları, nedensellikle mücadeleleri ve yeni durumlarla başa çıkmadaki kırılganlıkları gibi birçok sorunu çözebileceğine inanıyor. Sağduyu ve muhakeme, yapay zeka topluluğu için önemli araştırma alanlarıdır ve bunlar, derin öğrenmenin öncüleri de dahil olmak üzere, alandaki en parlak beyinlerden bazılarının odak noktası haline gelmiştir.

AGENT'i çözmek, insanların öngörülemeyen dünyasında sağlam davranan yapay zeka ajanları yaratmaya yönelik küçük ama önemli bir adım olabilir.

“İnsanları özerk ajanlara güvenmeye ikna etmek zor olacak. sağduyulu bir şekilde davranmayın" dedi Gutfreund. “Örneğin yaşlılara yardım eden bir robotu düşünün. Eğer bu robot, temsilcilerin hedeflerine etkili bir şekilde ulaştıkları yönündeki sağduyu ilkesini izlemezse ve buzdolabından süt getirmesi istendiğinde düz bir çizgi yerine zig zag şeklinde hareket ederse, ne çok pratik ne de güvenilir olacaktır.

AJAN şunun bir parçasıdır: Makine Sağduyusu Savunma İleri Araştırma Projeleri Ajansı'nın (DARPA) (MCS) programı. MCS iki geniş hedefi takip ediyor. Birincisi, çocuklar gibi nesneler, etmenler ve uzay hakkında akıl yürütmeyi öğrenebilen makineler yaratmak. AJAN bu kategoriye girer. İkinci hedef ise, bir insan araştırmacının yapacağı gibi, web'deki yapılandırılmış ve yapılandırılmamış bilgileri okuyarak öğrenebilecek sistemler geliştirmektir. Bu, yalnızca çok geniş bir metin kümesindeki kelimeler ve kelime dizileri arasındaki istatistiksel korelasyonları yakalamaya odaklanan doğal dil anlayışına yönelik mevcut yaklaşımlardan farklıdır.

"Artık AGENT'i bebekler için bir test ortamı olarak kullanmaya çalışıyoruz. DARPA MCS programı uygulayıcılarının geri kalanıyla birlikte, birden fazla aracı (örneğin, birbirlerine yardım etme veya engelleme) ve hedeflere ulaşmak için araçların kullanımı (örneğin, kapıları açan anahtarlar) ile ilgili daha karmaşık sağduyu senaryolarını keşfetmeyi planlıyoruz. . Ayrıca sezgisel fizik ve mekansal anlayışla ilgili diğer temel bilgi alanları üzerinde de çalışıyoruz" dedi Gutfreund.

Ben Dickson bir yazılım mühendisi ve TechTalks, teknolojinin sorunları çözme ve yaratma yollarını araştıran bir blog.

Bu hikaye başlangıçta yayınlandı bdtechtalks.com. Telif Hakkı 2021

VentureBeat

VentureBeat'in misyonu, teknik karar vericilerin dönüştürücü teknoloji ve işlem hakkında bilgi edinmesi için dijital bir şehir meydanı olmaktır. Sitemiz, kuruluşlarınıza liderlik ederken size rehberlik edecek veri teknolojileri ve stratejiler hakkında önemli bilgiler sunar. Sizi topluluğumuzun bir üyesi olmaya, erişmeniz için davet ediyoruz:

  • ilgilendiğiniz konular hakkında güncel bilgiler
  • bültenlerimiz
  • kapılı düşünce lideri içeriği ve ödüllü etkinliklerimize indirimli erişim, örneğin 2021 Transform: Daha fazla bilgi edin
  • ağ özellikleri ve daha fazlası

Üye ol

Kaynak: https://venturebeat.com/2021/07/27/can-you-teach-ai-common-sense/

Zaman Damgası:

Den fazla AI - VentureBeat