Google matcher ikke ChatGPT

Googles nye stolthet Bard er ikke like smart som ChatGPT. Men noe er den likevel best på.

Journalisten Jean Carroll fikk medhold i sitt søksmål mot Donald Trump, og medieomtalen var stor. Bing har ikke fått med seg det, men Bard har fått det med seg.

12.05.2023 20:14

Google har nå satt inn en helt ny motor i sin pratebot Bard. Den er søkekjempens forsøk på å ta igjen forspranget til den mye omtalte prateboten ChatGPT.

Aftenposten har kjørt totalt 20 tester på Bard. 10 av dem er spesiallaget av forskere for å sammenligne avanserte språkmodeller. Konklusjonen er at Bard er vesentlig smartere enn den vanligste utgaven av ChatGPT. Det er denne de fleste har prøvd.

Fakta ChatGPT og pratebotene Prateboten ChatGPT fra selskapet OpenAI har overrumplet verden med sin evne til å formulere seg. Den mest avanserte utgaven av ChatGPT kan resonnere selvstendig. Av de store selskapene er det Google som har kommet lengst i konkurransen med OpenAI. Kommende utgaver av språkmodellene kan også forstå bilder. Vis mer

Men Bard er ikke like smart som språkmodellen GPT-4, som er den mest avanserte motoren i ChatGPT. GPT-4 er i øyeblikket allment anerkjent som den aller smarteste.

I 2017 gjorde Googles egne eksperter et stort gjennombrudd med artikkelen «Attention is all you need». Den er regnet som grunnlaget for alle de store språkmodellene. Likevel klarer selskapet altså ikke å være best, selv om de pøser inn svært store ressurser.

Best på det siste

På tross av at den ikke er best på det vanskeligste, kan mange brukere komme til å foretrekke Bard til svært mange oppgaver. Den ferske versjonen som vi har testet over to dager, er nemlig langt bedre enn den utgaven som fikk aksjekursen til å stupe med 1000 milliarder kroner da den ble sluppet i mars.

En viktig grunn til dette potensialet, er at Bard kontinuerlig blir oppdatert med siste nytt. GPT-4 kjenner ikke til hendelser etter 2021. Microsofts søkemotor Bing har riktignok en egen versjon av GPT-4 som kan levere svar fra nyhetsbildet. Men i våre tester leverer Googles Bard klart høyere kvalitet.

Å teste en enorm språkmodell som Bard er en voldsomt stor oppgave. Microsoft brukte 16 forskere til å lage sin 140 sider lange rapport «Sparks of AGI» om GPT-4. Vår test må til sammenligning regnes som et førsteinntrykk. Likevel kan et slikt førsteinntrykk ha verdi. Vi har nemlig brukt kunnskapen forskerne kom frem til i denne rapporten til å designe spørsmål som er spesielt egnet.

Ved første øyekast kan det være vanskelig å skille spørsmål fra to språkmodeller som GPT-3.5 (som er motoren i gratisutgaven av ChatGPT) og GPT-4 (som det er lange ventelister for å få betale for). Men forskjellen er likevel voldsom. På en amerikansk eksamen i jus, scoret GPT-3 blant de ti prosent laveste studentene. GPT-4 scoret blant de ti prosent høyeste.

Slik gikk det

Jeg gjenbrukte derfor først ti av utfordringene fra rapporten. Utfordringene ble omskrevet lett, slik at Bard ikke kunne bruke sin kunnskap om dem fra nettsøk. Resultat: GPT-4 kom på førsteplass med 8 av 10 treff. Bard kom bak med 6 poeng. GPT-3.5 klarte bare 4 poeng.

Jeg gjenskapte for eksempel den krevende utfordringen med å stable egg og andre objekter oppå hverandre som vi tidligere har skrevet om. GPT-4 var fortsatt alene om å klare den.

fullskjerm neste Bard (bildet) gir en langt mer troverdig og oppdatert presentasjon av Donald Trumps posisjon i øyeblikket enn Bing med GPT-4 (neste bilde). 1 av 4

Å løse enkelte av utfordringene krever dyp menneskekunnskap. I flere av tilfellene fikk Bard godkjent, og dermed like mange poeng som GPT-4. Svaret fra GPT-4 var likevel av klart høyere kvalitet.

Et punkt Bard utmerker seg på, er matematikk. GPT-4 er overraskende dårlig, mens Bard ser ut til å ha en kalkulator innebygget. Samtidig er ikke en kalkulator vanskelig å få tak i nå til dags, så betydningen av denne fordelen er begrenset. På samme tid klarte ikke Bard noe så enkelt som å telle antall bokstaver i et langt ord. Det klarte begge modellene fra OpenAI.

God på nyheter

Når folk nå skal bestemme seg for om ChatGPT eller Bard skal være deres førstevalg, er det likevel klart at OpenAI har fått en formidabel konkurrent. Årsaken er at Bard er uovertruffen på nyheter. I min separate test av dette fikk den godkjent på 9 av 10 nyhetssøk, mens Bing BingBing-søket er delt i to. Du kan velge mellom å søke/prate i en sidespalte til høyre, eller i en hovedspalte til venstre. Kvaliteten på søket i sidespalten er svært avhengig av hva du samtidig har oppe i hovedspalten. Resultatene blir ofte feil, dersom du spør om noe helt annet i sidespalten enn det du har slått opp. Selv om vi gjorde alle disse søkene i hovedspalten, var Bing ikke i nærheten av å matche Bard. (selv med GPT-4) bare klarte 6 av 10.

Det å få de beste svarene fra de store språkmodellene har til nå krevd at du hele tiden har i bakhodet at de har ulik kompetanse. GPT-4 har som regel gitt de klokeste resultatene når du spør alt fra før 2021. Bing har vært den mest oppdaterte, men også mer overfladiske og upålitelige prateboten. Og gode, gamle Google har fortsatt vært best til kjappe og enkle søk.

Bard, derimot, åpner opp for at du kan bruke samme pratebot til både nytt og gammelt. Den har også et Google-søk bare et knappetrykk unna. En ulempe er likevel at Bard sjeldnere oppgir kildene sine i form av linker. Det gjør Bing. Generelt er inntrykket likevel at Bard er vesentlig mer pålitelig og oppdatert enn Bing.

Ikke norsk riktig ennå

En stor fordel med ChatGPT, er at begge utgaver forstår norsk. Foreløpig svarer Bard bare på engelsk. Den engelske utgaven er heller ikke tilgjengelig i Norge uten videre. Du må foreløpig bruke en såkalt VPN-tjeneste VPN-tjenesteEn VPN-tjeneste er en krypteringstjeneste for informasjon mellom deg og en server på nettet. Den skaper en virtuell tunnell til et annet sted. Med en slik tjeneste kan du få det til å se ut som du befinner deg i et annet land enn det du faktisk gjør. Pålitelige VPN-tjenester koster i størrelsesorden 50-150 kroner per måned for ubegrenset bruk. for å bruke den. Ifølge Google er den engelsktalende versjonen under utrulling til 180 land. En norsktalende utgave er allerede varslet, men tidspunktet er ikke kjent.

Bard har imidlertid en annen stor fordel: Den er gratis. GPT-3.5 er også gratis, mens du må betale for GPT-4. Siden vår test tyder på at Bard er klart bedre enn gratiskonkurrenten, kan OpenAI ikke hvile på laurbærene. Google har allerede varslet at deres neste generasjon er på vei. Den har kodenavnet Gemini, og står allerede og trener.

Å trene slike modeller tar typisk noen måneder. OpenAI sa for noen uker siden at GPT-5 ikke vil begynne sin trening før om «noe tid».

Hvem som har kommet lengst om et år, er derfor helt uvisst. Det eneste vi vet, er at et nytt kappløp om å være best på denne ekstremt kraftige teknologien nå er i gang.