Kunstig intelligens er langt mer enn en statistisk kalkulator

“Den bare gjetter neste ord” er blitt en seiglivet forenkling om generativ kunstig intelligens. Den er teknisk sett delvis riktig, samtidig som den kan få oss til å undervurdere en teknologi som allerede endrer hvordan vi lever, lærer, jobber, skaper, konkurrerer og tenker.

Jeg hører det stadig vekk. I møter, på konferanser, fra journalister, i kommentarfelt og i debatter. Noen lener seg litt tilbake, smiler overbærende og leverer det de tror er det avgjørende poenget:

Store språkmodeller regner bare ut hvilket ord som mest sannsynlig kommer etter det forrige. Som en avansert kalkulator.

Så er diskusjonen liksom ferdig. Den burde snarere begynne der.

Det er helt riktig at transformerbaserte språkmodeller er trent til å predikere neste token, som kan være et ord, en del av et ord eller et tegn, basert på konteksten som kom før. Det er den grunnleggende treningsmekanismen. Samtidig sier det omtrent like lite om hva som faktisk foregår som det er å forklare vår egen måte å tenke på ved å redusere det ned til at hjernen sender elektriske signaler mellom nevroner.

Det er sant på et grunnleggende nivå. Det er også nesten ubrukelig som forklaring på hvorfor du kan lese en roman og bli rørt, løse et problem du aldri har sett før, forstå ironi, skrive noe originalt eller endre mening etter en god samtale.

Prediksjon er mer interessant enn mange tror

Noe av det mest fascinerende med denne debatten er at prediksjon ofte blir brukt som et argument for at kunstig intelligens egentlig er banal. I hjerneforskningen er prediksjon derimot en av de mest sentrale forklaringsmodellene vi har for intelligens.

Nevroforskeren Karl Friston ved University College London har i mange år vært en sentral stemme bak det som ofte omtales som “predictive processing” og “free energy principle”.

Veldig forenklet handler dette om at hjernen hele tiden bygger interne modeller av verden, forsøker å forutsi hva som skjer videre, og oppdaterer disse modellene når virkeligheten avviker fra forventningene. Som for eksempel det å gripe en ball i fart, forstå ansiktsuttrykket til et annet menneske eller tolke stemningen i et rom.

Ingen av delene er passiv registrering av informasjon, men kontinuerlig prediksjon, korrigering og fortolkning.

Det gjør ikke hjernen til en enkel kalkulator. Det viser snarere hvor dypt prediksjon ligger i det vi kaller intelligens. Derfor blir det for enkelt å si at en språkmodell kun predikerer eller sannsynlighetsberegner det neste ordet. Det interessante er hva slags representasjoner, sammenhenger og mønstre som oppstår når prediksjon skjer i ekstrem skala, på enorme datamengder, gjennom mange lag av matematisk bearbeiding.

//Artikkelen fortsetter etter annonsen//

Det som faktisk skjer under panseret

En moderne stor språkmodell er ingen glorifisert søkemotor som slår opp ferdige setninger i en tabell. Den henter ikke bare frem tekst den har sett før. Den bygger sannsynlige svar gjennom et komplekst samspill mellom kontekst, mønstergjenkjenning, representasjoner og vekting av informasjon.

Et av de avgjørende gjennombruddene kom med transformerarkitekturen, beskrevet i forskningsartikkelen «Attention Is All You Need» i 2017. Kjernen er oppmerksomhetsmekanismen, som gjør at modellen kan vurdere relasjoner mellom ulike deler av teksten samtidig, i stedet for å behandle alt som en enkel sekvens fra venstre mot høyre. En setning tidlig i et dokument kan påvirke hva modellen genererer langt senere, fordi modellen hele tiden vurderer hvilke deler av konteksten som er relevante for det neste den skal skrive.

I tillegg består slike modeller av mange lag. Noen lag fanger opp enklere mønstre, som grammatikk, struktur og ordformer. Dypere lag kan håndtere mer abstrakte sammenhenger, som betydning, stil, logiske relasjoner, tone, intensjon og kontekst.

Det betyr ikke at modellen forstår verden slik mennesker gjør. Det betyr at den gjør langt mer enn å kaste terning om neste ord.

Forskning innen «mechanistic interpretability», blant annet fra Anthropic, har vist at store språkmodeller kan utvikle interne representasjoner av konsepter som er langt mer abstrakte enn enkeltord. Forskerne har identifisert mønstre som ser ut til å representere ideer, steder, egenskaper og sammenhenger på tvers av språk og uttrykksformer.

Det er fortsatt mye vi ikke forstår, og det er nettopp derfor den bastante avvisningen blir så problematisk.

Da forskerne selv ble overrasket

Et av de mest omdiskuterte funnene de siste årene handler om det som kalles fremvoksende evner. Forskerne Jason Wei og flere andre beskrev i 2022 hvordan enkelte evner ser ut til å dukke opp først når modellene når en viss størrelse. Plutselig kan en modell løse oppgaver den mindre modellen ikke håndterte, som flertrinns-resonnering, analogier eller mer komplekse språkoppgaver.

Denne forskningen har også møtt kritikk. Andre forskere har argumentert for at noen av de tilsynelatende brå sprangene kan skyldes målemetoder og statistiske effekter, snarere enn reelle kvalitative sprang i modellenes evner. Det gjør ikke temaet mindre interessant.

Tvert imot viser det hvor krevende det er å forstå hva som faktisk skjer når modeller skaleres opp.

Det er nettopp her jeg mener debatten ofte bommer. Vi trenger ikke å påstå at modellene er bevisste, har intensjoner eller forstår verden slik mennesker gjør, for å ta dem alvorlig. Det holder å konstatere at de allerede gjør ting som for få år siden ble avfeid som langt unna, og at de påvirker arbeid, kunnskap, konkurransekraft, utdanning, kommunikasjon og maktfordeling.

//Artikkelen fortsetter etter annonsen//

Faren ved å undervurdere teknologien

I boken min, Mennesket vs Maskinen, skriver jeg om et mønster jeg ser igjen og igjen: Vi undervurderer teknologi helt frem til den gjør noe vi ikke forventet. Deretter svinger vi ofte for langt i motsatt retning, enten i frykt eller i begeistring.

Begge deler gjør oss dårligere i stand til å ta kloke beslutninger.

Forenklingen om at kunstig intelligens bare predikerer neste ord gir en form for psykologisk trygghet. Den gjør det lettere å slippe å forholde seg ordentlig til teknologien. Hvis den bare er avansert statistikk, trenger vi kanskje ikke å endre måten vi lærer på. Kanskje trenger vi ikke å tenke nytt om arbeidslivet. Kanskje kan virksomheter fortsette som før, mens ledere holder et foredrag om AI en gang i året og tror at de har tatt ansvar.

Den tryggheten er falsk.

For det som skjer nå handler ikke bare om tekstproduksjon. Det handler om beslutningsstøtte, analyse, rådgivning, programmering, kundedialog, forskning, undervisning, innholdsproduksjon, organisering og etter hvert mer autonom problemløsning. Det handler også om hvem som får økt produktivitet, hvem som mister markedsverdi, hvilke selskaper som kontrollerer infrastrukturen, og hvordan kunnskap omsettes til økonomisk og politisk makt.

Hvis vi undervurderer teknologien, risikerer vi å møte den uforberedt. Som arbeidstakere. Som ledere. Som foreldre. Som politikere. Som samfunn.

Vi må snakke mer presist

Jeg mener ikke at store språkmodeller er mennesker. Jeg mener heller ikke at de har bevissthet, erfaring, kropp, moral eller dømmekraft slik mennesker har. Tvert imot er det helt avgjørende å skille mellom språkproduksjon, resonnering, forståelse, ansvar og intensjon.

Samtidig blir det like galt å redusere dem til enkle statistiske kalkulatorer. En slik beskrivelse gjør oss ikke mer kritiske. Den gjør oss bare mindre presise.

Språket vi bruker om teknologi former forventningene våre. Forventningene former beslutningene våre. Beslutningene former hvordan vi investerer, regulerer, organiserer og lærer. Derfor betyr det faktisk noe om vi omtaler kunstig intelligens som en litt artig tekstmaskin, en farlig guddom eller et kraftfullt verktøy vi fortsatt ikke fullt ut forstår.

Jeg tror det siste er det mest ærlige.

Filosofen John Searle argumenterte allerede i 1980, gjennom tankeeksperimentet «The Chinese Room», for at en maskin kan manipulere symboler uten å forstå betydningen av dem. Det er fortsatt et viktig argument i diskusjonen om bevissthet og forståelse. Samtidig har vi fortsatt ingen enkel konsensus om hva forståelse egentlig er, heller ikke hos mennesker.

Jo mer vi lærer om både hjernen og kunstige nevrale nettverk, desto vanskeligere blir det å late som om grensen er helt enkel å trekke.

//Artikkelen fortsetter etter annonsen//

Løsningen starter med nysgjerrig skepsis

Det vi trenger nå, er verken panikk eller begeistring uten bakkekontakt. Vi trenger nysgjerrig skepsis. Vi må forstå nok til å stille bedre spørsmål, gjøre bedre vurderinger og ta bedre valg.

For virksomheter betyr det at kunstig intelligens må ut av innovasjonsavdelingen og inn i kjernevirksomheten. Ikke som et moteord i strategien, men som praktisk kompetanse i hverdagen. Ansatte må lære hva teknologien faktisk kan brukes til, hvor den feiler, hvordan den bør kontrolleres, og hvilke oppgaver som fortsatt krever menneskelig erfaring, kontekstforståelse og etisk dømmekraft.

For skolen betyr det at vi må slutte å behandle kunstig intelligens som juks alene. Elever og studenter trenger å lære hvordan de kan bruke slike verktøy kritisk, kreativt og ansvarlig. Hvis vi lærer dem at teknologien bare gjetter, lærer vi dem også å undervurdere både mulighetene og risikoen.

For politikere betyr det at regulering må bygge på teknologisk forståelse, ikke bare moralsk uro eller næringspolitisk ønsketenkning. Vi må beskytte mennesker mot misbruk, manipulering, overvåkning og maktkonsentrasjon, samtidig som vi sørger for at Norge og Europa ikke blir passive brukere av teknologi andre kontrollerer.

For hver enkelt av oss betyr det at vi må ta et mer voksent ansvar for egen kompetanse. Det holder ikke å være for eller imot kunstig intelligens. Vi må lære oss å bruke den godt nok til å forstå hva den gjør med oss.

Mer kontroll begynner med bedre forståelse

Hvis vi klarer å snakke mer presist om kunstig intelligens, kan vi også handle mer presist. Da kan vi bruke teknologien til å styrke menneskelig kapasitet, ikke bare kutte kostnader. Vi kan bruke den til bedre læring, bedre beslutninger, bedre tjenester og mer tilgjengelig kompetanse, samtidig som vi bygger inn grenser, ansvar og transparens.

Det krever at vi slutter å trøste oss med enkle forklaringer.

Neste gang noen sier at kunstig intelligens bare predikerer neste ord, kan du gjerne spørre hva de tror hjernen gjør store deler av tiden. Svaret er mer ubehagelig, mer interessant og mer samfunnskritisk enn mange liker å innrømme.

Bilde: ChatGPT

Prediksjon er mer interessant enn mange tror

//Artikkelen fortsetter etter annonsen//

Det som faktisk skjer under panseret

Da forskerne selv ble overrasket

//Artikkelen fortsetter etter annonsen//

Faren ved å undervurdere teknologien

Vi må snakke mer presist

//Artikkelen fortsetter etter annonsen//

Løsningen starter med nysgjerrig skepsis

Mer kontroll begynner med bedre forståelse

Relaterte artikler