Guide
7 min lesing

Den store guiden til AI-bildegenerering: DALL-E, Midjourney og Stable Diffusion

Vi sammenligner de tre største AI-bildeverktøyene og viser deg når du bør bruke hvert av dem.

A
AIvett redaksjon

Den store guiden til AI-bildegenerering: DALL-E, Midjourney og Stable Diffusion

AI-bildegenerering er ikke lenger ett verktøy — det er et landskap av spesialiserte løsninger der de ulike alternativene brillierer på forskjellige ting. Å velge riktig verktøy for oppgaven er halvparten av jobben. Denne guiden gir deg det du trenger å vite om de tre dominerende alternativene, og hjelper deg å velge riktig.

DALL-E 3 (OpenAI): Tilgjengelighet og instruksjonsforståelse

DALL-E 3 er OpenAIs bildegenereringsmodell, innebygd direkte i ChatGPT. Det gjør den til det mest tilgjengelige alternativet — ingen separat konto, ingen Discord, bare skriv "lag et bilde av..." i ChatGPT-samtalen.

Styrker

Tekst i bilder: DALL-E 3 er den eneste av de tre store som konsekvent kan gjengi lesbar tekst i bilder. Vil du ha et bilde av et skilt med spesifikk norsk tekst, en plakat med tittel, eller en bok med tittel på forsiden — bruk DALL-E 3.

Instruksjonsforståelse: DALL-E 3 følger komplekse, spesifikke instruksjoner mer nøyaktig. Ber du om "fem røde biler, to blå og én gul, parkert i en halvbue foran en hvit kontorbygning" — DALL-E 3 er mer sannsynlig å levere akkurat det.

Integrasjon med ChatGPT: Du kan ha en samtale der du gradvis raffinerer bildet ved å be om endringer: "Gjør himmelen mer dramatisk", "Legg til en person i forgrunnen", "Endre bakgrunnen til natt". Denne konversasjonelle tilnærmingen er DALL-E 3s unike fordel.

Svakheter

Estetisk gjennomslagskraft er ikke like konsekvent høy som Midjourney. Bildene kan virke noe flate eller "korrekte" fremfor inspirerende. For ren kunstnerisk imponerende output er Midjourney bedre.

Priser

Inkludert i ChatGPT Plus (20 dollar/måned). Ingen separat konto nødvendig.

Midjourney: Kunstnerisk kvalitet og estetikk

Midjourney er det verktøyet profesjonelle designere og kreative fagfolk velger når de vil ha bilder som faktisk er vakre. Kvaliteten er konsekvent høy, og modellen tolker prompts med en kreativ frihet som kan gi resultater som overrasker og begeistrer.

Styrker

Estetisk kvalitet: Midjourney v6.1 produserer den jevneste kvaliteten av alle tilgjengelige modeller. Belysning, komposisjon og stemning er på et nivå som minner om profesjonell fotografering eller illustrasjon.

Stilkohesjon: Bilder fra Midjourney har en gjenkjennelig estetikk — men den er ikke monoton. Modellen kan levere alt fra fotorealisme til akvarell, fra art deco til cyberpunk, og gjøre det med ekte kunstnerisk forståelse.

Fotografisk realisme: For markedsføring og reklame er Midjourney standard. Produktbilder, miljøbilder og portretter (med forbehold om hender og ansikter) er bedre enn konkurrentene.

Svakheter

Ikke tilgjengelig uten abonnement. Hender er fortsatt problematisk. Tekst i bilder er upålitelig. Instruksjonsforståelse er ikke like presis som DALL-E 3 — Midjourney tolker friere og kan avvike fra detaljerte spesifikasjoner.

Priser

Fra 10 dollar/måned (Basic, 200 bilder) til 60 dollar/måned (Pro med stealth-modus).

Stable Diffusion: Frihet, kontroll og privathet

Stable Diffusion er et åpen kildekode-prosjekt. Modellvektene er fritt tilgjengelige, og med riktig oppsett kjøres det helt lokalt på din egen maskin. Ingenting lastes opp til noen sky, ingenting koster penger per bilde (etter at du har satt opp maskinvaren).

Styrker

Fullstendig kontroll: Med ControlNet kan du styre komposisjon, positurer og strukturen i bilder på en måte de andre ikke tillater. Du kan gi modellen en skisse og be den male det om, eller gi den et bilde av en person i en positur og generere ny karakter i samme positur.

Finjustering (fine-tuning): Du kan trene Stable Diffusion på egne bilder. Vil du at modellen skal lage bilder av din merkevares spesifikke look, eller i stilen til en bestemt grafisk profil? Det er mulig — og resultater fra godt trente modeller er imponerende.

Personvern: Bilder forlater aldri maskinen din. For sensitivt innhold (medisinsk bildeanalyse, proprietær design) er dette avgjørende.

Pris: Gratis, bortsett fra maskinvarekostnad (GPU med 8+ GB VRAM anbefalt).

Svakheter

Teknisk terskel for oppsett er høy. Default kvalitet uten spesialiserte modeller er lavere enn Midjourney. Krever teknisk forståelse for å utnytte avanserte funksjoner.

Promptstruktur som fungerer på tvers av alle

Uavhengig av verktøy fungerer denne strukturen:

[Subjekt] + [Setting/kontekst] + [Stil/estetikk] + [Tekniske detaljer]

Eksempel:

An elderly Norwegian woman knitting by a window, coastal village in winter, oil painting, warm interior light vs. cold exterior, Johannes Vermeer lighting style, highly detailed

Generelle prompting-tips

  • Mer spesifikt er nesten alltid bedre
  • Lyssetting er det viktigste estetiske valget du tar
  • Negative prompts hjelper: si hva du ikke vil ha ("no text, no watermark, avoid blurry")
  • Ikke bruk levende kunstneres navn som stilreferanse — det er etisk tvilsomt og kan gi juridiske problemer

Opphavsrett: Hva du faktisk bør vite

Situasjonen er kompleks og i utvikling. Det generelt aksepterte rådet:

  • Adobe Firefly: Trygt for kommersiell bruk (Adobe garanterer det)
  • DALL-E 3: OpenAIs vilkår gir deg eierskap til bilder generert, men begrensningene kan endre seg
  • Midjourney: Kommersielle rettigheter inkludert i betalte planer, men juridisk situasjon er uavklart
  • Stable Diffusion lokalt: Du eier bildene, men modellen er trent på opphavsrettsbeskyttet materiale