OpenAI kunngjorde GPT-4 på tirsdag, den siste iterasjonen av den verdensberømte chatboten som har fanget fantasien til internett siden lanseringen i november i fjor.
MetaNews tok til sosiale medier for å avdekke hva brukere har gjort med den oppgraderte teknologien, og for å finne ut hva botens største gevinster og tap er så langt.
Vi kunngjør GPT-4, en stor multimodal modell, med våre beste resultater noensinne når det gjelder muligheter og justering: https://t.co/TwLFssyALF pic.twitter.com/lYWwPjZbSg
- OpenAI (@OpenAI) Mars 14, 2023
Vinnerne
Siden lanseringen av GPT-4 brukere har vært opptatt av å dele seirene sine med chatboten, og gevinstene stables opp.
En av de store overskriftene siden lanseringen av GPT-4 er at boten har en uhyggelig evne til å bestå standardiserte eksamener med små vanskeligheter i det hele tatt. Advokateksamenen, som potensielle advokater må avlegge for å praktisere advokatvirksomhet, er blant dem boten nå kan bestå med glans (90 %). Andre eksamener inkluderte LSAT jusseksamen (88%) og GRE Quantitative Math (80%).
Her er noen flere av de store gevinstene for GPT-4.
Fra doodle til nettside
I en demonstrasjon av sine evner forvandlet GPT-4 en håndtegnet skisse til et funksjonelt nettsted. Nettstedet er absolutt veldig grunnleggende, men det er et solid proof of concept.
Jeg har nettopp sett GPT-4 gjøre en håndtegnet skisse til et funksjonelt nettsted.
Dette er galskap. pic.twitter.com/P5nSjrk7Wn
— Rowan Cheung (@rowancheung) Mars 14, 2023
£5,000 og 2 uker spart
En lur bruker videresendt hvordan de var i stand til å utnytte GPT-4 til å skrive kode for 5 mikrotjenester for et nytt produkt. I følge brukeren siterte en "veldig god" utvikler £5,000 2 og sa at de trengte 4 uker for å fullføre jobben. Ved å bruke GPT-3 klarte brukeren å fullføre jobben på bare XNUMX timer.
Identifiser sikkerhetshull i smarte kontrakter
En annen søknad for GPT-4 identifiserer sikkerhetshull i Ethereums smarte kontrakter, som, når de utnyttes, kan resultere i tyveri og tap av betydelige pengesummer.
Conor Grogan, direktøren for Coinbase, demonstrerte evnen fra Twitter-kontoen sin videre tirsdag.
"Jeg dumpet en live Ethereum-kontrakt inn i GPT-4," sa Grogan. «På et øyeblikk fremhevet den en rekke sikkerhetssårbarheter og pekte på overflateområder hvor kontrakten kunne utnyttes. Det bekreftet da en spesifikk måte jeg kunne utnytte kontrakten på.»
Jeg tror at AI til syvende og sist vil bidra til å gjøre smarte kontrakter tryggere og enklere å bygge, to av de største hindringene for masseadopsjon.
— Conor (@jconorrogan) Mars 14, 2023
Tapene
Et av de største tapene for ChatGPT kom direkte fra egne sosiale medier. Boten spår 20 jobber den potensielt kan erstatte i nær fremtid, med roller som spenner fra Data Entry Clerk til Recruiter og Copywriter.
Jobber som #GPT-4 vil erstatte, skrevet av GPT-4: pic.twitter.com/aMrwQHnfwH
— ChatGPT (@ChatGPT_0penAI) Mars 16, 2023
Ikke så raskt, GPT-4.
Selv om kreftene til GPT-4 kan være imponerende, har roboten fortsatt en betydelig vei å gå før den kan erstatte arbeidet til et dyktig menneske. Eksempel: CNET. Da teknologipublikasjonen nylig erstattet menneskelige forfattere med sine egne copywriting AI, var artiklene den utløste intet mindre enn katastrofale. Den boten var absolutt ikke ChatGPT – men den illustrerer hvor raskt ting kan løse seg når du forlater en chatbot å gjøre menneskelig arbeid med lite tilsyn.
Når det gjelder forestillingen om at GPT-4 kan erstatte en "Data Entry Clerk" eller "Recruiter" - dette anstrenger godtroenhet til et absolutt bristepunkt. Ingen GPT-4, ingen faller for dette.
Her er noen andre eksempler på GPT-4-feil rapportert av brukere av sosiale medier.
GPT-4 er lei av de forferdelige spørsmålene dine
En av de forventede fordelene ved å bruke en bot til å skrive koden din, slik at, i motsetning til en innleid programvareingeniør, vil roboten aldri bli trett, senke farten eller kjede seg. Det er i hvert fall håpet.
En bruker rapportert at når du spurte GPT-4 om «lange kodesegmenter», virket AI «å kjede seg» og rett og slett stoppet oppgaven halvveis. Etter å ha observert denne oppførselen fortsatte brukeren med å si: "Denne tingen blir mer menneskelig for hver dag..."
MetaNews foreslår å gi GPT-4 flere interessante prosjekter eller betale mer.
Mislykket seier
Prøvde det logiske puslespillet nedenfor på GPT-4 uten ytterligere spørsmål eng. GPT-3.5 pleide å mislykkes spektakulært på dette puslespillet med endeløse hallusinasjoner, mens GPT-4 mislyktes bare mindre spektakulært.
Fortsatt lang vei å gå for å oppnå robuste resonneringsevner, men det er et fremskritt.
— Shital Shah (@sytelus) Mars 14, 2023
Ja, "feil bare mindre spektakulært," kan være den svakeste av svak ros, men det er fortsatt fremgang. Kanskje denne bør kalles en 'ødelagt seier.'
Heltall mislykkes
Lite GPT-4-funn: ChatGPT-4 kan sortere heltall der N=20, feiler ofte når N=21, og nesten alltid feiler når N=22. Vennligst fortell meg hva dette betyr.
— Adam (@traditionalboi) Mars 16, 2023
Det betyr at du må gå tilbake til å gjøre heltall i hodet ditt.
Tapet som trodde det var en seier
Det har vært hastverket med å identifisere betydelige brukstilfeller for GPT-4, ikke alle har hatt tid til å stoppe opp og faktisk tenke ut om gevinsten deres virkelig var en seier eller ikke.
Dette fenomenet ble illustrert av en overbegeistret bruker som forklarte hvordan han var i stand til å bruke Visual-ChatGPT til å skanne et bilde av et kjøleskap fylt med frukt, ost, kjøtt, egg og andre hovedingredienser inn i chatboten. Brukeren beordret den deretter til å levere fem oppskrifter fra ingrediensene den identifiserte, alt på bare 60 sekunder.
Brukeren delte deretter GPT-4s utgang med det han beskrev som fem "ganske anstendige matoppskrifter." Disse oppskriftene var fruktsalat, osteomelett, skinke- og ostesmørbrød, fruktsmoothie og ost- og fruktfat.
Det ville internett var imidlertid raskt ute med å påpeke at de fleste av disse forslagene knapt er noen form for oppskrift i det hele tatt, enn si en anstendig oppskrift. Enda verre, tre av de såkalte oppskriftene er ganske enkelt varianter av å legge frukt på en tallerken eller i en annen beholder.
I rettferdighet til GPT-4, av de 20 jobbene den spådde den kunne erstatte, var ikke Chef én.
Likevel, hvis alt dette snakket om mat har skapt en appetitt, kan du gjerne prøve ut GPT-4s "ganske greie" oppskrift på "skinke- og ostesmørbrødet."
- SEO-drevet innhold og PR-distribusjon. Bli forsterket i dag.
- Platoblokkkjede. Web3 Metaverse Intelligence. Kunnskap forsterket. Tilgang her.
- kilde: https://metanews.com/gpt-4-users-share-its-wins-and-losses-on-social-media/
- :er
- $OPP
- 000
- 10
- 7
- 9
- a
- evner
- evne
- I stand
- Absolute
- Ifølge
- Logg inn
- oppnå
- faktisk
- Adam
- Ytterligere
- Adopsjon
- fordeler
- AI
- Alle
- alene
- alltid
- blant
- og
- annonsert
- dukket opp
- appetitt
- Søknad
- ER
- områder
- artikler
- AS
- At
- tilbake
- Bar
- grunnleggende
- BE
- før du
- være
- tro
- under
- Stor
- Biggest
- Bored
- Bot
- Breaking
- bygge
- by
- som heter
- CAN
- evner
- saken
- saker
- Gjerne
- chatbot
- ChatGPT
- CNET
- kode
- coinbase
- fullføre
- konsept
- selvsikkert
- betydelig
- kontrakt
- kontrakter
- kunne
- dato
- dataregistrering
- leverer
- demonstrert
- beskrevet
- Utvikler
- Vanskelighetsgrad
- direkte
- Regissør
- katastrofal
- gjør
- ned
- enklere
- Egg
- Endless
- ingeniør
- entry
- ethereum
- alle
- eksamen
- eksempler
- forventet
- forklarte
- Exploit
- Exploited
- FAIL
- mislykkes
- svak
- rettferdighet
- Falling
- langt
- FAST
- Noen få
- fylt
- Finn
- finne
- flying
- mat
- Til
- Gratis
- fra
- Frukt
- funksjonelle
- framtid
- få
- få
- Go
- Ha
- hode
- Overskrifter
- hjelpe
- Fremhevet
- Holes
- håp
- TIMER
- Hvordan
- Men
- HTTPS
- menneskelig
- i
- identifisert
- identifisere
- identifisering
- fantasi
- imponerende
- in
- inkludert
- SINNSYK
- instant
- interessant
- Internet
- IT
- køyring
- DET ER
- Jobb
- Jobb
- jpg
- Keen
- Type
- stor
- Siste
- siste
- lansere
- Law
- advokater
- Permisjon
- Leverage
- lite
- leve
- Lang
- tap
- tap
- gjøre
- Mass
- Masseadopsjon
- math
- max bredde
- midler
- Media
- microservices
- modell
- penger
- mer
- mest
- Nær
- Trenger
- Ny
- nytt produkt
- Forestilling
- November
- Antall
- of
- on
- ONE
- OpenAI
- rekkefølge
- Annen
- produksjon
- oppsyn
- egen
- betalende
- kanskje
- fenomen
- bilde
- plato
- Platon Data Intelligence
- PlatonData
- vær så snill
- Point
- potensielt
- krefter
- praksis
- spådd
- forutsi
- Produkt
- Progress
- prosjekter
- bevis
- proof of concept
- Utgivelse
- Sette
- puslespillet
- kvantitativ
- Rask
- raskt
- spenner
- nylig
- .
- oppskrifter
- erstatte
- erstattet
- rapportert
- påkrevd
- resultere
- Resultater
- robust
- roller
- jag
- sikrere
- Sa
- skanne
- sekunder
- sikkerhet
- segmenter
- Del
- delt
- Kort
- bør
- signifikant
- ganske enkelt
- siden
- dyktig
- langsom
- Smart
- Smarte kontrakter
- smarte kontrakter
- So
- så langt
- selskap
- sosiale medier
- Software
- Software Engineer
- solid
- noen
- Noen
- spesifikk
- stabling
- Staff
- Tilstand
- uttalte
- Still
- Stopp
- stoppet
- stammer
- foreslår
- summer
- overflaten
- Snakk
- Oppgave
- tech
- Det
- De
- tyveri
- deres
- ting
- ting
- Tenk
- trodde
- tre
- Gjennom
- tid
- dekk
- til
- forvandlet
- sant
- tirsdag
- SVING
- Til syvende og sist
- avdekke
- oppgradert
- bruke
- Bruker
- Brukere
- verifisert
- seire
- Sikkerhetsproblemer
- Vei..
- Nettsted
- uker
- Hva
- om
- hvilken
- mens
- HVEM
- vil
- vinne
- Vinner
- med
- uten
- Arbeid
- arbeidet
- skrive
- skriv kode
- skriving
- skrevet
- Din
- zephyrnet