Sagen om hjemmelavede store sprogmodeller - KDnuggets

Tilfældet med hjemmelavede store sprogmodeller – KDnuggets

Kildeknude: 2539953

De fleste af de bemærkelsesværdige LLM'er er dygtige til udbredte sprog som engelsk, men dækker ikke den sproglige mangfoldighed, der effektivt kan tjene de globale kulturelle og regionale nuancer. 

 

Tilfældet med hjemmelavede store sprogmodeller
Billede af forfatter

At bygge hjemmedyrkede LLM'er er et betydeligt teknologisk skridt og kræver dets fortjeneste. Det danner hovedsageligt præcedens for alle at være en del af denne digitale transformation, hvilket gør en win-win for begge – ved at tillade bredere rækkevidde til kunder såvel som at gøre det muligt for virksomheder at udvide deres rækkevidde, forbinde og betjene forskellige kundebaser over hele verden . 

AI finder tiltalende use cases i mange applikationer, mens den håndterer kognitiv overbelastning, nem adgang til information og forbedrer kundeoplevelsen.

LLM'erne, der er uddannet i forskellig sproglig spredning, dækker alle tre grunde, hvilket giver nem og rettidig adgang til informationen. En sådan facilitering af viden lige ved hånden kan hjælpe mange lokalsamfund med at få den meget nødvendige hjælp og støtte til at få løst deres henvendelser.

Selvom vi har dækket en del terræn til fordel for at bygge sådanne modeller, er det lige så vigtigt at fremhæve, at en sådan modeludvikling kræver adgang til data på lokale sprog. Det er overflødigt at sige, at det kan virke udfordrende i starten, men er ikke uopnåeligt. 

Faktisk bliver det hurtigt en velsignelse for lokalsamfund i form af datamærkning (mere om dette i det kommende afsnit), når dataindsamlingsprocesser opbygges effektivt i skala. 

 

Tilfældet med hjemmelavede store sprogmodeller
Billede af forfatter
 

Desuden kræver udvikling af LLM'er højtydende computerinfrastruktur, såsom GPU'er og cloud computing-tjenester, hvilket er dyrt og kræver en sponsor/partner for at yde økonomisk opbakning.

Uundgåeligt afhænger enhver nations succes af at bygge billigere og mere energieffektive chips til at bygge den næste generation af AI-modeller. Det har også brug for øget F&U-finansiering for at lette en platform for hjernekraft til at komme sammen gennem omfattende samarbejde mellem akademi, industri og regering.

Data er ikke den nye olie længere, men den, der ved, hvordan man behandler så store datasæt, hvilket øger behovet for energieffektive chips.

Ud over software kræver udvikling af modeller trænet i lokale sprog finansiering af F&U inden for avanceret teknologi og opbygning af selvforsyning med hardware. Yderligere er de store modeller stærkt afhængige af datacentre, der kræver omfattende strøm, hvilket øger behovet for strømbesparende chips.

Det giver en følelse af enhed, hvor vi inkluderer alle for at være en del af dette teknologiske gennembrud, og mens de gør det, får de også mulighed for at blive en del af den digitale verden alias data, så den næste bølge af nye modeller inkluderer dem også, og løser sagen om urigtige oplysninger fremover.

LLM'er uddannet i lokale sprog ville ikke kun have datadominans, men ville også spille en stor rolle i at fremme forskellige kulturer.

Mens de fleste mener, at LLM'er kan påvirke beskæftigelsessektoren negativt, er der også en positiv side ved det. Det er en win-win for det giver beskæftigelsesmuligheder til teknologiudviklerne såvel som hele deltagerne i hele værdikæden af ​​en sådan teknologistabel.

Derudover kan fjernelse af barriererne for, hvordan ikke-engelsktalende kan bruge teknologi, føre til at forbedre deres liv på meningsfulde måder. Det kan åbne døren til muligheder og gøre dem til aktive deltagere i, hvordan verden drives i dag.

Der vil blive skabt flere arbejdspladser. At skabe forskelligartede data kan se ud som en udfordring for nogle pålydende. Alligevel, når det først er gjort effektivt i skala, kan det hurtigt blive en mulighed for at give lønmuligheder til bidragyderne. Lokalsamfund kan deltage i sådanne datagenereringsinitiativer og deltage i denne revolution på det grundlæggende niveau, mens de bliver anerkendt for at spille deres rolle i form af løn og royalties for deres bidrag.

Adgang til viden er den største løftestang, og digitalisering har været en stor udligner. Forholdet mellem "lærere, advokater, lægers støtte" og "befolkningen" er angiveligt lavt i udviklingslande sammenlignet med udviklede nationer, hvilket tydeligt fremhæver den kløft, der effektivt kan bygges bro over af applikationer, der hjælper kunderne med at løse problemer i de tidlige stadier eller modtage vejledning til de næste trin. Dette bliver muligt, hvis brugeren er fortrolig med samtalesproget fra AI-drevne chatbots.

 

Tilfældet med hjemmelavede store sprogmodeller
Billede af forfatter
 

Overvej sektorer som landbrug, hvor LLM'er kan hjælpe landmænd uden nogen sprogbarriere. Landmænd kan få vejledning om bedste praksis for kunstvanding og forbedring af effektiv brug af vand. 

Tag et andet eksempel fra sundhedssektoren. At forstå de komplekse domænespecifikke vilkår i disse forsikringer er en udfordring for os alle. At åbne en chatbot, der kan udnytte sin adaptive vejledningsstil til at uddanne alle samfund i det sprog, de forstår, er en stor indsats for at skabe ligestilling. 

AI-modeller, der inkluderer forskellige sprog, hjælper med at bygge bro over den digitale kløft og bringe alle på lærredet af muligheder, der følger med sådanne teknologiske fremskridt. Vigtigst af alt sætter en sådan inklusivitet det tiltrængte fokus på de marginaliserede sektioner og gør dem til en nøgledeltager i denne revolutionære forandring. Det tager højde for etiske overvejelser ved også at give retfærdig adgang til lokale grupper.
 
 

Vidhi Chugh er en AI-strateg og en digital transformationsleder, der arbejder i krydsfeltet mellem produkt, videnskab og teknik for at bygge skalerbare maskinlæringssystemer. Hun er en prisvindende innovationsleder, en forfatter og en international foredragsholder. Hun er på en mission om at demokratisere maskinlæring og bryde jargonen for, at alle kan være en del af denne transformation.

Tidsstempel:

Mere fra KDnuggets