Dyk in i framtiden med Kaggles AI-rapport 2023 – Se vad som är hett - KDnuggets

Dyk in i framtiden med Kaggles AI-rapport 2023 – Se vad som är hett – KDnuggets

Källnod: 2363719

Dyk in i framtiden med Kaggles AI-rapport 2023 – Se vad som är hett
Bild av redaktör
 

Den 12 maj 2023 öppnade Kaggle ett konkurrens där Kaggle-communityt kan delta i att bygga en rapport som kommer att sammanfatta de snabba framstegen inom AI från de senaste två åren. Kaggle-gemenskapen är en mångfaldig grupp som har en mängd olika erfarenheter inom djupet av AI. 

Deltagarna ombads skriva en uppsats om ett visst ämne baserat på förändringarna och utvecklingen under de senaste 2 åren, till exempel Generativ AI, AI-etik och mer. 

Smakämnen rapporten finns här och består av följande avsnitt:

  • Generativ AI
  • Textdata
  • Bild- och videodata
  • Tabell- och tidsseriedata
  • Kaggle-tävlingar
  • AI-etik

Så låt oss dyka in i vad vi har lärt oss...

Generativ AI har varit ett populärt samtalsämne nyligen. Detta startavsnitt dyker in i de snabba framstegen och tillämpningarna av Generativ AI under de senaste 2 åren. Vi har sett framsteg som textgenerering, bildskapande och musikutveckling med hjälp av verktyg och tekniker som GAN och LLM. 

Detta har bara varit möjligt med användning av större datamängder och förbättrad hårdvara för att förbättra algoritmer under deras träningsfas. Även om Generativ AI fortfarande är i ett tidigt skede, har den bara under det senaste året visat hur den revolutionerar olika branscher. Det finns fortfarande etiska problem att ta hänsyn till, såsom integritetsproblem, felaktig information och användning av dessa AI-system. 

Läs vidare i de olika uppsatserna:

  1. Generativ AI
  2. Förstå, skapa och förvandla världen
  3. En glimt av Generativ AIs rike

Med hypen kring Generativ AI har intresset för Natural Language Processing (NLP) ökat kraftigt på grund av uppkomsten av stora språkmodeller (LLM). Naturligtvis fokuserar nästa avsnitt av Kaggle AI-rapporten på NLP-tekniker och deras användning i olika uppgifter som sammanfattning och översättning. 

Om vi ​​tar tillbaka det, inkluderade tidiga tillvägagångssätt för textbaserade uppgifter term-frekvensbaserad funktionsteknik i kombination med icke-neurala nätverksbaserade maskininlärningsmetoder. Nu tillgodoser vi större datamängder som genomgår lärande ordrepresentation för modelltolkning. 

Användningen av internetdata som en utbildningskorpus har gjort det möjligt för dessa modeller att lära sig bättre och ge bättre prestanda inom områden som överföringslärande. Inom Kaggle-tävlingar har det funnits en trend att finjustera allmänt tillgängliga modeller som har visat sig överträffa prestanda på mänsklig nivå. 

Följande toppuppsatser fokuserar på uppkomsten och de senaste teknikerna för LLM:er:

  1. Samtida stora språkmodeller LLMs
  2. Stora språkmodeller: Resonemangsförmåga
  3. Minijättar: "Små" språkmodeller

Precis som textdata som används i uppgifter som innehållsgenerering, har bild- och videogenerering också varit mycket populärt. Datorseende har funnits länge, men de senaste åren har det skjutit i höjden. Vi kan nu hantera uppgifter som objektdetektering med mera. 

Det här avsnittet dyker in i modellarkitekturer såväl som vanliga metoder som används inom datorseende, såsom augmentation. Används i en mängd olika branscher som sjukvård för medicinsk bildbehandling, datorseende har fortfarande sina utmaningar inom områden som djupa förfalskningar, etiska och filosofiska överväganden, begränsningar av multimodala modeller med mera. 

Vi har modeller som Segment Anything Model (SAM) och YOLO (You Only Look Once) som har visat hur generaliserade, öppen källkodsmodeller kan anpassas för olika och unika uppgifter.

Dyk in i framstegen inom bild- och videodata med dessa uppsatser:

  1. Framsteg i AI Vision-modeller under de senaste två åren
  2. Bild- och videodata

Nästa avsnitt dyker in i den historiska betydelsen av tabelldata och tidsseriedata. Båda dessa har inte varit så populära under de senaste åren eftersom de inte har haft samma inverkan som revolutionen för djupinlärning. Men det finns fortfarande mycket använda och mycket effektiva trender inom områden som:

  • Unikt tillvägagångssätt för individuella datamängder/problem
  • Vikten av dataförbehandling och funktionsteknik
  • Dominansen av gradientförstärkta träd

Inom Kaggle-communityt har dessa trender blivit mycket erkända och följande essäer kommer att dyka in i dessa såväl som de unika utmaningar som tabell- och tidsseriedata stöter på. 

  1. Lärdomar från den typiska tabellformiga pipelinen
  2. Tidsserier och tabelldata
  3. Tabelldata i AI-tiden

En del av denna rapport från Kaggle-communityt var att också analysera Kaggle-tävlingar genom att titta på dess utveckling och communityns observationer av den under de senaste 2 åren. Kaggle-tävlingar har varit mycket populära genom åren eftersom communityn har använt plattformen för att testa sina färdigheter, bygga en portfölj och förbereda sig för den verkliga världen. 

Observationer av förändringar i Kaggle-tävlingar är tekniker som pseudomärkning, medelvärdesberäkning av fröer och bergsklättring som en gång i tiden ansågs vara "trick", men som nu har blivit vanliga metoder. Kaggle-tävlingar under de senaste 2 åren har blivit mer konkurrenskraftiga och tävlingar som RSNA, Learning Agency med flera är mycket populära. 

Dyk in i de vinnande tricken från Kaggle-tävlingar:

  1. Mot grön AI
  2. Hur man vinner en Kaggle-tävling
  3. Tävlingar för medicinsk bildbehandling

Etik kring AI är också ett annat område av oro, där många människor från samhället har blandade känslor om användningen och implementeringen av AI-system. Organisationer undersöker de etiska principerna för AI och skapar nya strategier för att säkerställa att de inte bara kan förstå AI-systemen utan också kunna övervaka och mildra risker. 

Det är ingen akademisk studie utan en samhällelig sådan, det finns många åsikter som är viktiga för att förstå AI-världen och hur den fortfarande kan användas samtidigt som samhällets värderingar värnas. Vi har sett organisationer genomgå kontinuerlig revision av sina AI-system med antagandet av etik-by-design. 

Lär dig mer om utmaningarna kring AI och vilken inverkan det har på samhället:

  1. Utforska AI-etikens landskap
  2. Utveckling inom AI och etik under de senaste 2 åren
  3. Etisk AI är allt vi behöver!!

Kaggle-teamet har skapat en unik rapport där det har låtit sitt community uttrycka sina åsikter och erfarenheter av AI-världen och dess förändringar under de senaste 2 åren. Låt oss veta om det var ett särskilt avsnitt eller en uppsats du tyckte var mycket intressant!
 
 

Nisha Arya är datavetare och frilansande teknisk skribent. Hon är särskilt intresserad av att ge Data Science karriärråd eller handledning och teoribaserad kunskap kring Data Science. Hon vill också utforska de olika sätten artificiell intelligens är/kan gynna människans livslängd. En angelägen lärande, som vill bredda sina tekniska kunskaper och skrivförmåga, samtidigt som hon hjälper andra att vägleda.

Tidsstämpel:

Mer från KDnuggets