Viten

Kan kunstig intelligens «forstå» språk?

AI-modeller blir stadig bedre i å håndtere språkdata, men sammenlignet med oss mennesker er deres forståelse fortsatt veldig overfladisk.

Virtuelle assistenter som Siri er eksempler på teknologiske løsninger som behandler språkdata. Men har de klart å «knekke språkkoden»? spør artikkelforfatterne. Foto: Shutterstock, NTB

  • Pierre Lison
    forsker i maskinlæring og språkteknologi, Norsk Regnesentral
  • Ingrid Lossius Falkum
    førsteamanuensis i lingvistikk og kommunikasjonsfilosofi, Universitetet i Oslo
Viten er Aftenpostens satsing på forskning og vitenskap, der forskere og fagfolk fra hele landet bidrar med artikler.

Kunstig intelligens (AI) er i vinden, og nyhetsstrømmen florerer av artikler om muligheter og trusler knyttet til AI. En gren av kunstig intelligens som har fått stor oppmerksomhet, er språkteknologi. Språkteknologi har vært med oss lenge, men i de siste årene kan vi stadig oftere lese påstander om at AI endelig har klart å «knekke språkkoden» og kan «forstå» språk like godt eller bedre enn oss mennesker. Men stemmer det?


Språklig gjettelek

Språkmodeller er basert på såkalte «dype nevrale nettverk». For å kunne utføre en oppgave må modellen først trenes. Språkmodeller henter treningsdata fra enorme tekstsamlinger med opptil flere hundre milliarder ord, for eksempel fra Wikipedia. Modellene er trent til å utføre én enkelt oppgave: å forutsi ord i kontekst.

For eksempel, gitt en ufullstendig setning som «Avisen kommer på ...» må modellen gjette det neste ordet, som kan være «trykk» eller «bygda», men lite sannsynlig «hår» eller «hoppe». Denne gjetteleken kan virke unyttig, men underveis lærer språkmodellen både grammatiske regler og fakta, for eksempel at aviser kan trykkes.

Slike språkmodeller kan deretter brukes til ulike oppgaver. Tekster som er produsert ved hjelp av slike store språkmodeller, er forbausende gode og vanskelige å skille fra tekster skrevet av ekte mennesker. Men betyr dette at modellen også har «forstått» teksten den har produsert?

Pierre Lison, forsker i maskinlæring og språkteknologi, Norsk Regnesentral og Ingrid Lossius Falkum, førsteamanuensis i lingvistikk og kommunikasjonsfilosofi, Universitetet i Oslo. Foto: Privat og Ketil Blom Haugstulen


Konteksten er avgjørende

For oss mennesker er det å forstå og kommunisere gjennom språk tilsynelatende enkelt. Alle gjør det jo, hele tiden. Men hvordan gjør vi det? Det er for eksempel ikke så rent lite imponerende når samtalepartneren vår umiddelbart forstår at selv om vi sier «Ibsen står nede i kjellerstuen», så mener vi ikke at det er Ibsen selv som står der nede.

En viktig innsikt innenfor moderne psykologi og kommunikasjonsforskning er at vi forstår språk gjennom å foreta slutninger om våre samtalepartneres intensjoner. Først må vi kjenne til den konvensjonelle betydningen til ordene vi bruker. Men slik kunnskap om den språklige koden er ikke nok. For å forstå en språklig ytring må vi også anvende bakgrunnskunnskap og kontekst for å danne oss en hypotese om hva taleren kan ha ment å kommunisere.

For eksempel, ta ytringen «Det er sent». Avhengig av konteksten kan den være ment som en oppfordring til å gå hjem, om at det snart er leggetid, eller kanskje som et negativt svar på et spørsmål om å være med på puben. Det er gjennom slutninger om talerens intensjoner at mening oppstår.

Les også

Hva vil vi bruke kunstig intelligens til? | Ingierd, Mikkelsen og Tørresen


Helseråd fra språkmodeller

En språkmodell er ikke i stand til å foreta slike slutninger. Den avgjørende forskjellen er at disse modellene utelukkende forholder seg til det vi kaller språklig form. Men når barn lærer ordbetydninger, gjør de det ved å knytte en språklig form til noe virkelig, sansbart eller abstrakt, ute i den fysiske verden eller i tankeverdenen. Dette har ikke språkmodellene tilgang til.

Det er mulig å avfeie den naive (over) troen på nevrale språkmodeller som en «hype» som vil gå over av seg selv. Men misforståelser rundt disse AI-systemene kan ha alvorlige konsekvenser. Noen forskningsmiljøer – heldigvis ikke i Norge – har for eksempel utforsket bruken av språkmodeller til å gi helseråd. Her er modellen trent på tekster om helserådgivning og er optimert for å produsere helseråd som «ligner» mest mulig på disse i tilsvarende kontekster.

Dette er naturligvis et overfladisk mål. Det er som om legeutdanningen skulle trene studenter i å herme etter andre leger i stedet for å lære dem hvordan menneskekroppen fungerer og sykdommer kan kureres. I tillegg er disse modellene ikke i stand til å forklare hvorfor de har valgt et bestemt svar. Språkmodeller integrerer ikke noe eksplisitt kunnskap om fysiologi, patologi eller behandling. De klarer dermed ikke å resonnere seg frem til et helsefaglig «riktig» svar.

Les også

Kunstig intelligens skriver så godt at utviklerne ikke tør slippe den løs


Overfladisk

Er nevrale språkmodeller dermed verdiløse? Naturligvis ikke. De kan vise til verdifulle resultater i en rekke oppgaver, fra spørsmålsbesvarelse til automatisk oversettelse. Og modellene har utvilsomt tilegnet seg en del kunnskap om språket og verden rundt oss.

Men denne «forståelsen» forblir overfladisk, siden kunnskapen er begrenset til hvordan forekomster av ord er korrelert med hverandre i tekst. Vi trenger en mer edruelig tilnærming til teknologisk utvikling innen AI, som også innebærer en diskusjon av feltets begrensninger.

Følg Aftenposten Viten på Facebook og Twitter!

  1. Les også

    Hvordan kan jeg vite at du er deg i sosiale medier?

  2. Les også

    Tre forsikringskjemper satser på kunstig intelligens for å avsløre juksere

Les mer om

  1. Språk
  2. Teknologi
  3. AI
  4. Viten

Relevante artikler

  1. VITEN

    Nei, fedme blant pasienter med alvorlige infeksjoner er neppe beskyttende

  2. VITEN

    Står vi overfor et gjennombrudd for genetiske vaksiner?

  3. VITEN

    Tirsdag lanseres oversikt over 44.000 arter i Norge. Men vi vet egentlig ganske lite.

  4. VITEN

    Nå kommer «værmeldingen» for ulv, bjørn og jerv

  5. VITEN

    NRK gir et ubalansert bilde av forskning i TV-serien «Håpets marked».

  6. VITEN

    Taredyrking er i ferd med å bli stor industri. Er vi forberedt?