Claude 3.7 Sonnet: Anthropics beste modell hittil

Anthropic lanserte Claude 3.7 Sonnet i februar 2025, og mottakelsen blant utviklere og fagfolk var umiddelbart positiv. I løpet av dagene etter lansering ble den rangert som nummer én på flere uavhengige koderangeringer, og mange som daglig bruker AI-verktøy sier det er den første modellen som virkelig utfordrer vanen med å starte ChatGPT.

Hva er nytt i 3.7?

Extended Thinking — nå i produksjon

Den viktigste nyheten er at "extended thinking" er tilgjengelig som en brukerstyrt funksjon. Det betyr at du kan be Claude eksplisitt om å tenke grundig gjennom et problem — og du ser hele resonneringsprosessen i sanntid, inkludert når modellen revurderer seg selv eller oppdager feil i eget resonnement.

Dette er vesentlig annerledes enn OpenAIs tilnærming der tenke-prosessen er skjult. Muligheten til å følge med på Claudes tankerekke gir innsikt i hvordan den kom frem til svaret — noe som er verdifullt enten du vil verifisere en vurdering eller bare forstå logikken.

Forbedret koding

SWE-bench Verified er en benchmark der modeller løser reelle GitHub-issues — ikke konstruerte kodeoppgaver, men faktiske bugs og feature requests fra åpen kildekode-prosjekter. Claude 3.7 Sonnet scorer 62,3 % med standard modus og hele 70,3 % med extended thinking aktivert. GPT-4o scorer til sammenligning rundt 38 %.

I praksis er dette merkbart. Claude 3.7 Sonnet forstår store kodebaser bedre, gjør færre logiske feil på refaktorering, og er særlig sterk på å identifisere rotårsaken til bugs fremfor bare å fikse symptomet.

Bedre instruksjonsføling

En av klagene mot tidligere Claude-versjoner var at modellen av og til tilføyde unødvendige forbehold, nektet å svare på legitime forespørsler, eller la til lange ansvarsfraskrivelser. Claude 3.7 Sonnet er merkbart mer direkte. Den følger instruksjoner bedre og respekterer det du ber om uten å overstyre med egne preferanser.

Svakheter og begrensninger

Internett-tilgang: Claude 3.7 Sonnet har begrenset websøk-funksjonalitet. ChatGPT Search er mer polert og integrert. Hvis du primært trenger sanntidsinformasjon fra nettet, er ChatGPT fortsatt et bedre valg.

Bildegenerering: Claude kan ikke generere bilder. DALL-E 3 (via ChatGPT) og Midjourney er fortsatt alternativene der.

Hastighet med extended thinking: Når extended thinking er aktivert, kan responstiden øke til 30–120 sekunder avhengig av problemets kompleksitet. For enkle samtaler er det ikke verdt å aktivere.

Kontekstvindu: 200 000 tokens er solid, men Gemini 2.0 Ultras 1 million tokens er fortsatt overlegen for analyse av svært lange dokumenter.

Praktiske brukstilfeller der 3.7 skiller seg ut

Juridisk dokumentanalyse: Claude 3.7 er spesielt god på å analysere kontrakter, identifisere problematiske klausuler og sammenfatte implikasjoner. Den presise instruksjonsfølingen gjør det enkelt å be den fokusere på bestemte aspekter.

Teknisk skriving: Dokumentasjon, spesifikasjoner, README-filer. Claude 3.7 produserer teknisk prosa av høy kvalitet uten unødvendig fyll.

Kodegjennomgang: Lim inn kode og be om en gjennomgang. Claude identifiserer sikkerhetsproblemer, ytelsesflaskehalser og mønstre som bryter med beste praksis — med begrunnelse for hvert punkt.

Tilgjengelighet og pris

Claude 3.7 Sonnet er tilgjengelig gratis med meldingsgrense på Claude.ai, og uten grense med Claude Pro (20 dollar per måned). Via Anthropic API koster den 3 dollar per million input tokens og 15 dollar per million output tokens — vesentlig billigere enn GPT-4o og OpenAIs o1-serie.

For bedrifter er Claude for Enterprise tilgjengelig med sterkere datahåndteringsgarantier, SOC 2-sertifisering og ingen bruk av data til modelltrening.