OpenAI Sora vil revolusjonere det kreative landskapet

Sora er ikke bare en teknisk bragd, men et vindu inn i en fremtid hvor de kreative grensene blir stadig mer utvidet, omdefinert og utfordret.

15. februar 2024 blir muligens ikke et like stort «Jesus-øyeblikk» som 30. november 2022, men OpenAI og Sam Altman har nok engang sendt globale sjokkbølger over internett med annonseringen av det generative AI-verktøyet Sora, som kan produsere ekstremt overbevisende videoer basert på enkle tekst-prompter. Det er ikke noe nytt i seg selv, da tjenester som blant annet Runway ML har eksistert en liten stund allerede. Forskjellen mellom Runwal ML gen2 (samt en rekke andre verktøy) og OpenAIs Sora, er at der de andre begrenser seg til noen få sekunder og det er enkelt å se at det er snakk om generativ AI, kan Sora produsere minutt-lange videoer hvor det er vanskelig å skille mellom hva som er virkelig og hva som er virtuelt.

Samme prompt, to forskjellige verktøy

En av videoene du kan la deg imponere av på OpenAIs nettside hvor Sora annonseres, er av en kvinne som går i en av Tokyos gater. OpenAI har vært så generøse å dele med oss selve tekstprompten de har benyttet til å lage den minutt-lange videoen. Slik ser tekst-prompten ut:

A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.

Jeg kopierte inn tekst-prompten i Runwal ML-verktøyet, som brukte et par minutter på å lage en 4 sekunder lang video:

Resultatet av den samme tekst-prompten når den er brukt på Sora, ser derimot slik ut:

Forskjellene er mildt sagt formidable, selv om det må sies at Sora ikke er 100 prosent perfekt. Men utviklingen fra de første tekst-til-video-eksemplene, til hva Runway ML klarer å lage i dag, og hva som er i ferd med å bli lansert fra OpenAI, er nesten på nivå med det «Jesus-øyeblikket» verden ble vitne til da OpenAI lanserte ChatGPT 30. november 2022.

Hva er Sora?

Når OpenAI lanserer Sora for publikum som oss, flytter vi grensene igjen for hva som er mulig å skape av detaljerte og naturtro videoer fra bare tekst. Og denne gangen blir grensene flyttet veldig langt. Såpass langt at jeg mistenker det er fryktelig mange som driver med videoproduksjon i dag – alt fra reklame, kortfilm, dokumentarer, TV-serier og spillefilmer – som frykter hva konsekvensene kan bli. Sora er ikke bare en teknisk bragd, men et vindu inn i en fremtid hvor de kreative grensene blir stadig mer utvidet, omdefinert og utfordret.

OpenAI har allerede demonstrert deres evne til å utnytte store mengder med data til avansert språkforståelse. Denne gangen blir de samme dataene benyttet til å produsere virkelighetstro videoer. Det som virkelig imponerer meg med Sora, er verktøyets evne til å fange komplekse bevegelser, skygger, lyssetting, dybde og uttrykk, noe som vitner om en særs dyp integrasjon av kreativitet på den ene siden og teknologisk innovasjon på den andre.

Det er ikke vanskelig å se for seg alle de potensielle anvendelsene for Sora, det være seg markedsføringsvideoer som kan produseres raskere og mer kostnadseffektivt, til kreative verktøy for filmskapere og animatører som ikke har de samme budsjettene som de største filmskaperne, men kanskje de samme visjonene. Samtidig kan det selvsagt også tenkes at disse verktøyene kan misbrukes til å lage svært overbevisende desinformasjon, til spredning av falske nyheter, svindel, propaganda og annet innhold skapt for å skape uro, splittelse, polarisering og hat. Derfor er også OpenAI tydelige på at de vil være forsiktige med å slippe dette verktøyet ut i markedet, før de kan være (forholdsvis) sikre på at verktøyet også er trygt å bruke.

Etiske vurderinger blir viktigere

Enn så lenge henger lovverket langt etter utviklingen. EUs lov om utvikling og bruk av kunstig intelligens er fortsatt langt unna en lansering og enda lenger unna håndheving. Her til lands vil ikke myndighetene forby desinformasjon og det er ingenting som tyder på at markedsføring og kommunikasjon generert av kunstig intelligens må merkes på noen som helst måte. Annonseringen av Sora markerer et fascinerende kvantesprang hva gjelder AI-utviklingen. I kjølvannet blir spørsmålene om hva som er riktig – både juridisk og etisk – hva angår kreativitet og teknologisk innovasjon.

Her befinner jeg meg selv på begge sider av diskusjonen; Sora er et «levende» bevis på teknologiens potensial til å forbedre vår verden, samtidig som Sora også er en viktig påminnelse om at utviklingen må være trygg, ansvarlig og bærekraftig. Det er ikke alt som er mulig å få til med teknologi, som nødvendigvis vil gjøre verden til et bedre sted. Selv om det til og med vil være innenfor loven å ta det i bruk, er det kanskje ikke riktig, fra et etisk perspektiv. Når det er sagt, har jeg ingen tro på at etikken vil vinne over økonomien, så her bør politikerne slutte å prate og heller handle. Og det raskt.

Samme prompt, to forskjellige verktøy

Hva er Sora?

Etiske vurderinger blir viktigere

Relaterte artikler