Det er veldig vanskelig å lage en algoritme som vil kunne klare å skille mellom genuin barneporno og bildet av nakne Kim Phúc fra Vietnamkrigen, kunne VGs Hilde Skjølberg fortelle folk flest.

Det er utvilsomt riktig. Men hva slags konsekvenser bør den innsikten få?

Aldri perfekt

Facebooks algoritme for klassifisering av bilder blir til ved maskinlæring: Algoritmen «lærer» ved å generalisere, basert på et stort antall eksempler.

Algoritmen kan klassifisere bilder i henhold til ulike kriterier og blant annet avgjøre om det er sannsynlig at noe er pornografisk.

Men alle slike algoritmer gjør klassifikasjonsfeil: Noen ikke-pornografiske bilder blir feilaktig klassifisert som pornografiske (såkalte falske positive), mens noen bilder som er pornografiske blir feilaktig klassifisert som ikke-pornografiske (såkalte falske negative).

Det er komplisert og kostbart å konstruere gode algoritmer, og vi vil aldri klare å lage en som er perfekt.

Den menneskelige vurderingen av bilder er rik, nyansert, subjektiv, kulturelt betinget og endres over tid.

Hva forteller det oss? Hva bør vi gjøre med de uperfekte algoritmene våre?

Unntak er naivt

Noen teknologers svar synes å være at vi må leve med konsekvensene av falske positive – som at bildet av Kim Phúc blir sensurert fordi det feilaktig blir klassifisert som barneporno.

Argumentasjonen går ut på at algoritmenes verdi oppveier eventuelle ulemper. Det er en feilslutning.

At en algoritme indikerer at et bilde kan inneholde barneporno, trenger ikke å være ensbetydende med at bildet sensureres.

Det vil si: Iverksettingen av tiltak trenger ikke å være helautomatisert selv om deteksjonen skulle være det. Det er da heller ikke slik at Facebook helautomatiserer tiltakene.

Noen har tatt til orde for at Facebook bør legge inn unntak for kjente ikoniske bilder. Det kan naturligvis Facebook gjøre, men det løser ikke problemet. Det er en naiv tilnærming som snur problemet fullstendig på hodet.

Problemet er egentlig ikke hvordan man unngår å markere bildet av Kim Phúc som barneporno, men hvordan man hindrer sensur av det neste ikoniske bildet som får en hel verden til å få øynene opp for et pågående overgrep mot en befolkning.

Gamle og velkjente falske positive er det lett å håndtere. Det er de nye, falske positive som er problematiske.

Hvem er ansvarlig?

Men det slutter ikke her. Facebook er jo ikke alene om å benytte maskinlæringsalgoritmer.

Nå som maskinlæring og dataanalyse blir brukt i stadig større grad, på stadig flere områder, må vi ta opp de prinsipielle problemstillingene.

Å gjemme seg bak at «algoritmen sa det», er en uholdbar ansvarsfraskrivelse

Hvordan sørger vi for at algoritmene våre er så «sunne» som mulig? Hvordan måler vi presisjonen til algoritmene våre?

Hva er godt nok? Hva er for dårlig? Hva er konsekvensene av falske negative kontra falske positive?

Hvem eier ansvaret for disse konsekvensene?

Vi er på vei inn i de falske positives tidsalder, og da må vi ha øynene åpne. Vi har bare så vidt begynt å se konturene av det som vil komme.

Vi vet for eksempel at maskinlæring blir brukt i etterretningsarbeid til å identifisere og eliminere mulige dissidenter og terrorister.

Hvor gode er algoritmene som blir brukt i dette arbeidet? Hvordan blir presisjonen målt? Hvem holdes ansvarlig for dårlig maskinlæring og overoptimistiske algoritmer?

Uskyldige henrettes

Det er ikke opplagt at svaret er oppløftende.

Flere tusen uskyldige mennesker kan ha blitt feilaktig klassifisert som terrorister av en overivrig NSA-algoritme, og på grunn av dette blitt drept av droner.

Falske positive betyr altså i denne sammenheng at uskyldige mennesker blir «henrettet» uten rettssak og uten dom – justismord i sin mest bokstavelige form.

Å gjemme seg bak at «algoritmen sa det» er en uholdbar ansvarsfraskrivelse, all den tid det er vi mennesker som vedtar å ta i bruk maskinslæringsalgoritmer, og bestemmer hvilke tiltak som skal settes automatisk i gang – basert på algoritmenes påstander.

