Nyhet
5 min lesing

Sora: OpenAIs AI-videogenerator er her - og den er imponerende

OpenAI har lansert Sora, en AI som lager realistiske videoer fra tekstbeskrivelser. Vi tester grensene.

A
AIvett redaksjon

Sora: OpenAIs AI-videogenerator er her — og den er imponerende

OpenAI lanserte Sora for allmennheten i desember 2024 etter et år med kontrollerte forhåndsvisninger og intens spekulasjon. Mottakelsen var noe delt — de høyeste forventningene ble ikke innfridd på alle punkter, men det råder liten tvil om at Sora representerer et genuint skifte i hva AI kan gjøre med video.

Hva er Sora?

Sora er en tekst-til-video-diffusjonsmodell. Du skriver en tekstbeskrivelse — en "prompt" — og modellen genererer en video som svarer til beskrivelsen. Teknisk sett er det en av de mest komplekse utfordringene i moderne AI: modellen må forstå ikke bare semantisk innhold, men romlig forståelse, bevegelse over tid, lysforhold, fysikk og konsistens.

Maksimal lengde er ett minutt per klipp, med oppløsning opptil 1080p. Outputen er ikke redigert annet enn av Soras egne valg — du får det modellen produserer, ikke en montasje.

Det som faktisk imponerer

Romlig og visuell konsistens

Soras mest imponerende egenskap er evnen til å holde scener konsistente over tid. Kameraet kan bevege seg rundt en bygning, og bygningens form og detaljer forblir konsistente — noe tidligere modeller slet enormt med. Skyggene følger en konsekvent lysretning. Personer har gjenkjennbart utseende gjennom klippet (selv om dette ikke er ufeilbarlig).

Cinematografisk forståelse

Sora forstår kameravokabular på en måte som er bemerkelsesverdig. Du kan spesifisere "slow dolly shot", "aerial establishing shot", "close-up tracking shot" og modellen leverer noe som faktisk ligner. Dette er nyttig for folk som vil lage b-roll-materiale til presentasjoner, YouTube-videoer eller sosiale medier uten tilgang til et kamerateam.

Estetisk kvalitet

Standardkvaliteten er gjennomgående høyere enn fra konkurrenter som Runway Gen-3 og Kling på fotorealistiske scener. Naturscener — skog, hav, fjell — er spesielt overbevisende.

Begrensningene er reelle

Fysikk: Sora kan lage imponerende videoer, men den "forstår" ikke fysikk i den forstand at den har simulert en fysisk verden. Konsekvensen er at video med komplekse fysiske interaksjoner — en ball som spretter, vann som renner, objekter som kolliderer — kan se merkelig ut. Det er ikke konsekvent, men det skjer ofte nok til å merkes.

Hender og ansikter: Dette er det klassiske AI-problemet som ikke er løst. Hender med feil antall fingre, ansikter som endrer seg subtilt, er fortsatt reelle problemer. For innhold der disse detaljene er kritiske, er Sora ikke klar for produksjon uten nøye seleksjon av genererte klipp.

Tekstgjengivelse: Tekst i video er vanskelig for alle AI-videosystemer, og Sora er ikke noe unntak. Hvis du trenger et kors med tekst, et skilt med spesifikt innhold, eller en bilderamme med korrekt tittel, vil resultatet sannsynligvis skuffe.

Konsistens på tvers av klipp: Sora er god på konsistens innenfor ett klipp. På tvers av klipp — å opprettholde samme karakter, lokasjon eller objekt i en lengre produksjon — er fortsatt et uløst problem.

Priser og tilgjengelighet

Sora er inkludert i ChatGPT Plus (20 dollar per måned) med en månedlig kvote på 50 "priority" videogenerasjoner. ChatGPT Pro (200 dollar per måned) gir ubegrenset tilgang. Det er også et dedikert Sora.com-grensesnitt med noe mer avanserte kontroller enn via ChatGPT.

Tilgangen er foreløpig noe begrenset i visse regioner på grunn av regulatoriske hensyn, men Norge er inkludert uten restriksjoner.

Praktiske brukstilfeller allerede nå

For folk som lager innhold til sosiale medier, presentasjoner eller intern kommunikasjon er Sora allerede nyttig — ikke som en produksjonsklar løsning, men som et verktøy for rask prototyping og b-roll-materiale. Det å generere 20 klipp og velge ut de 3 som ser bra ut er en akseptabel arbeidsflyt for mye innhold.

Reklamebransjen og markedsføring er de segmentene som ser mest interesse. Konsept-videoer for pitch, A/B-testing av visuelle ideer, og rask produksjon av innhold for annonsering er alle realistiske brukstilfeller der ROI er tydelig.