OpenAI annoncerede GPT-4 tirsdag, den seneste iteration af den verdensberømte chatbot, der har fanget internettets fantasi siden lanceringen i november sidste år.
MetaNews tog til sociale medier for at afdække, hvad brugerne har lavet med den opgraderede teknologi, og for at finde ud af, hvad bottens største gevinster og tab er indtil videre.
Annoncering af GPT-4, en stor multimodal model, med vores bedste resultater nogensinde med hensyn til muligheder og tilpasning: https://t.co/TwLFssyALF pic.twitter.com/lYWwPjZbSg
- OpenAI (@OpenAI) Marts 14, 2023
Sejrene
Siden lanceringen af GPT-4 brugere har været ivrige efter at dele deres sejre med chatbotten, og gevinsterne stables op.
En af de store overskrifter siden lanceringen af GPT-4 er, at botten har en uhyggelig evne til at bestå standardiserede eksamener med lidt besvær overhovedet. Advokateksamenen, som kommende advokater skal aflægge for at udøve advokatvirksomhed, er blandt dem, botten nu kan bestå med glans (90 %). Andre eksamener omfattede LSAT-juraeksamenen (88 %) og GRE Kvantitativ matematik (80 %).
Her er et par flere af de store gevinster til GPT-4.
Fra doodle til hjemmeside
I en demonstration af sine evner transformerede GPT-4 en håndtegnet skitse til en funktionel hjemmeside. Hjemmesiden er bestemt meget grundlæggende, men det er et solidt proof of concept.
Jeg har lige set GPT-4 forvandle en håndtegnet skitse til en funktionel hjemmeside.
Dette er sindssygt. pic.twitter.com/P5nSjrk7Wn
— Rowan Cheung (@rowancheung) Marts 14, 2023
5,000 kr. og 2 uger sparet
En snu bruger videresendte hvordan de var i stand til at udnytte GPT-4 til at skrive kode til 5 mikrotjenester til et nyt produkt. Ifølge brugeren citerede en "meget god" udvikler £5,000 og sagde, at de krævede 2 uger for at fuldføre jobbet. Ved at bruge GPT-4 var brugeren i stand til at fuldføre jobbet på kun 3 timer.
Identificer sikkerhedshuller i smarte kontrakter
En anden ansøgning til GPT-4 identificerer sikkerhedshuller i Ethereums smarte kontrakter, som, når de udnyttes, kan resultere i tyveri og tab af betydelige pengesummer.
Conor Grogan, direktøren for Coinbase, demonstrerede evnen fra sin Twitter-konto Tirsdag.
"Jeg dumpede en live Ethereum-kontrakt i GPT-4," sagde Grogan. "På et øjeblik fremhævede den en række sikkerhedssårbarheder og pegede på overfladeområder, hvor kontrakten kunne udnyttes. Det bekræftede derefter en specifik måde, jeg kunne udnytte kontrakten på."
Jeg tror på, at kunstig intelligens i sidste ende vil hjælpe med at gøre smarte kontrakter sikrere og nemmere at bygge, to af de største hindringer for masseadoption.
— Conor (@jconorrogan) Marts 14, 2023
Tabene
Et af de største tab for ChatGPT kom direkte fra dets egne sociale medier. Botten forudser 20 jobs, som den potentielt kan erstatte i den nærmeste fremtid, med roller lige fra Data Entry Clerk til Recruiter og Copywriter.
Jobs der #GPT-4 vil erstatte, skrevet af GPT-4: pic.twitter.com/aMrwQHnfwH
— ChatGPT (@ChatGPT_0penAI) Marts 16, 2023
Ikke så hurtigt, GPT-4.
Selvom kræfterne i GPT-4 kan være imponerende, har botten stadig et betydeligt stykke vej tilbage, før den kan erstatte et dygtigt menneskes arbejde. Eksempel: CNET. Da den tekniske publikation for nylig erstattede menneskelige forfattere med sine egne copywriting AI, de artikler, den udskrev, var intet mindre end katastrofale. Den bot var bestemt ikke ChatGPT – men den illustrerer, hvor hurtigt tingene kan løse sig, når du forlader en chatbot at udføre menneskeligt arbejde med lidt overblik.
Hvad angår ideen om, at GPT-4 kunne erstatte en "Data Entry Clerk" eller "Recruiter" - dette belaster godtroenhed til det absolutte bristepunkt. Nej GPT-4, ingen falder for dette.
Her er nogle andre eksempler på GPT-4-fejl rapporteret af brugere af sociale medier.
GPT-4 er træt af dine frygtelige spørgsmål
En af de forventede fordele ved at bruge en bot til at skrive din kode som, at i modsætning til en hyret softwareingeniør, vil botten aldrig blive træt, sænke farten eller kede sig. Det er i hvert fald håbet.
En bruger rapporteret at når man bad GPT-4 om "lange kodesegmenter", så AI'en ud til at "kede sig" og simpelthen stoppede opgaven halvvejs igennem. Ved at observere denne adfærd fortsatte brugeren med let at sige: "Denne ting bliver mere menneskelig for hver dag..."
MetaNews foreslår at give GPT-4 flere interessante projekter eller betale mere.
Fejlens sejr
Prøvede nedenstående logiske puslespil på GPT-4 uden yderligere prompt eng. GPT-3.5 plejede at fejle spektakulært i dette puslespil med endeløse hallucinationer, mens GPT-4 kun fejler mindre spektakulært.
Der er stadig lang vej at gå for at opnå robuste ræsonnementer, men det er et fremskridt.
— Shital Shah (@sytelus) Marts 14, 2023
Ja, "svigter kun mindre spektakulært," kan være den svageste af svage ros, men det er stadig fremskridt. Måske skal denne kaldes en 'ødelagt sejr'.
Heltal fejler
Lille GPT-4-fund: ChatGPT-4 kan sortere heltal, hvor N=20, fejler ofte, når N=21, og næsten altid fejler, når N=22. Nogen, fortæl mig, hvad det betyder.
— Adam (@traditionalboi) Marts 16, 2023
Det betyder, at du skal tilbage til at lave heltal i dit hoved.
Tabet, der troede, det var en sejr
Sådan har travet været med at identificere væsentlige use cases for GPT-4, ikke alle har haft tid til at stoppe op og rent faktisk tænke ud, om deres sejr virkelig var en sejr eller ej.
Dette fænomen blev indbegrebet af en overspændt bruger, der forklarede, hvordan han var i stand til at bruge Visual-ChatGPT til at scanne et billede af et køleskab fyldt med frugter, oste, kød, æg og andre basisingredienser ind i chatbotten. Brugeren beordrede den derefter til at levere fem opskrifter fra de ingredienser, den identificerede, alt sammen på kun 60 sekunder.
Brugeren delte derefter trygt GPT-4's output med, hvad han beskrev som fem "ganske anstændige madopskrifter." Disse opskrifter var frugtsalat, osteomelet, skinke- og ostesandwich, frugtsmoothie og oste- og frugtfad.
Det vilde internet var dog hurtig til at påpege, at de fleste af disse forslag næsten ikke er nogen form for opskrift overhovedet, endsige en anstændig opskrift. Endnu værre, tre af de såkaldte opskrifter er simpelthen variationer af at lægge frugt på en tallerken eller i en anden beholder.
Retfærdigvis over for GPT-4 var Chef ikke en af de 20 job, den forudsagde, at den kunne erstatte.
Alligevel, hvis al denne snak om mad har skabt appetit, er du velkommen til at prøve GPT-4's "ganske anstændige" opskrift på "skinke- og ostesandwichen."
- SEO Powered Content & PR Distribution. Bliv forstærket i dag.
- Platoblokkæde. Web3 Metaverse Intelligence. Viden forstærket. Adgang her.
- Kilde: https://metanews.com/gpt-4-users-share-its-wins-and-losses-on-social-media/
- :er
- $OP
- 000
- 10
- 7
- 9
- a
- evner
- evne
- I stand
- absolutte
- Ifølge
- Konto
- opnå
- faktisk
- Adam
- Yderligere
- Vedtagelse
- fordele
- AI
- Alle
- alene
- altid
- blandt
- ,
- annoncerede
- dukkede
- appetit
- Anvendelse
- ER
- områder
- artikler
- AS
- At
- tilbage
- Bar
- grundlæggende
- BE
- før
- være
- Tro
- jf. nedenstående
- Big
- Største
- Bored
- Bot
- Breaking
- bygge
- by
- kaldet
- CAN
- kapaciteter
- tilfælde
- tilfælde
- sikkert
- chatbot
- ChatGPT
- CNET
- kode
- coinbase
- fuldføre
- Konceptet
- trygt
- betydelig
- kontrakt
- kontrakter
- kunne
- data
- indtastning af data
- levere
- demonstreret
- beskrevet
- Udvikler
- Vanskelighed
- direkte
- Direktør
- katastrofal
- gør
- ned
- lettere
- Æg
- Endless
- ingeniør
- indrejse
- ethereum
- alle
- eksamen
- eksempler
- forventet
- forklarede
- Exploit
- Exploited
- FAIL
- mislykkes
- svag
- fairness
- Faldende
- langt
- FAST
- få
- fyldt
- Finde
- finde
- flyvende
- mad
- Til
- Gratis
- fra
- Frugter
- funktionel
- fremtiden
- få
- få
- Go
- Have
- hoved
- Overskrifter
- hjælpe
- Fremhævet
- Huller
- håber
- HOURS
- Hvordan
- Men
- HTTPS
- menneskelig
- i
- identificeret
- identificere
- identificere
- fantasi
- imponerende
- in
- medtaget
- SINDSSYG
- øjeblikkelig
- interessant
- Internet
- IT
- iteration
- ITS
- Job
- Karriere
- jpg
- Keen
- Venlig
- stor
- Efternavn
- seneste
- lancere
- Lov
- Advokater
- Forlade
- Leverage
- lidt
- leve
- Lang
- off
- tab
- lave
- Masse
- Masseadoption
- matematik
- max-bredde
- midler
- Medier
- microservices
- model
- penge
- mere
- mest
- I nærheden af
- Behov
- Ny
- nyt produkt
- Begreb
- november
- nummer
- of
- on
- ONE
- OpenAI
- ordrer
- Andet
- output
- Tilsyn
- egen
- betale
- måske
- fænomen
- billede
- plato
- Platon Data Intelligence
- PlatoData
- Vær venlig
- Punkt
- potentielt
- beføjelser
- praksis
- forudsagde
- forudsige
- Produkt
- Progress
- projekter
- bevis
- Bevis for koncept
- Offentliggørelse
- Sætte
- puslespil
- kvantitativ
- Hurtig
- hurtigt
- spænder
- for nylig
- opskrift
- Opskrifter
- erstatte
- udskiftes
- rapporteret
- påkrævet
- resultere
- Resultater
- robust
- roller
- haste
- sikrere
- Said
- scanne
- sekunder
- sikkerhed
- segmenter
- Del
- delt
- Kort
- bør
- signifikant
- ganske enkelt
- siden
- faglært
- langsom
- Smart
- Smarte kontrakter
- smarte kontrakter
- So
- indtil nu
- Social
- sociale medier
- Software
- Software Engineer
- solid
- nogle
- Nogen
- specifikke
- stabling
- Personale
- Tilstand
- erklærede
- Stadig
- Stands
- stoppet
- Stammer
- foreslår
- beløb
- overflade
- Tal
- Opgaver
- tech
- at
- tyveri
- deres
- ting
- ting
- Tænk
- tænkte
- tre
- Gennem
- tid
- dæk
- til
- omdannet
- sand
- Tirsdag
- TUR
- Ultimativt
- afdække
- opgraderet
- brug
- Bruger
- brugere
- verificeres
- sejre
- Sårbarheder
- Vej..
- Hjemmeside
- uger
- Hvad
- hvorvidt
- som
- mens
- WHO
- vilje
- vinde
- Vinder
- med
- uden
- Arbejde
- arbejdede
- skriver
- skriv kode
- skrivning
- skriftlig
- Din
- zephyrnet