Anthropic hat am Donnerstag, dem 28. Mai 2026, sein neues Spitzenmodell Claude Opus 4.8 veröffentlicht. Es ist ein Upgrade des erst gut einen Monat alten Opus 4.7 – ein Tempo, das die schnelle Update-Kadenz im aktuellen KI-Wettlauf unterstreicht. Anthropic selbst nennt das neue Modell bemerkenswert nüchtern eine "bescheidene, aber spürbare Verbesserung" gegenüber dem Vorgänger. Die wirklich interessanten Punkte stecken weniger im reinen Leistungssprung als im Schwerpunkt des Updates – und in dem, was Anthropic für die kommenden Wochen ankündigt.

Wir ordnen ein, was neu ist, wo die Grenzen liegen und was als Nächstes geplant ist.

Transparenzhinweis: Dieser Artikel wurde mit Claude erstellt – also mit einem Modell genau des Unternehmens, dessen neues Produkt hier besprochen wird. Wir stützen uns ausschließlich auf offizielle Angaben von Anthropic sowie auf unabhängige Berichterstattung (TechCrunch, VentureBeat, Axios, The Decoder, Gizmodo) und ordnen auch kritische Stimmen ein.

Der Schwerpunkt: Ehrlichkeit statt reiner Leistung

Das auffälligste Merkmal von Opus 4.8 ist nicht ein Benchmark-Rekord, sondern ein Verhaltensmerkmal: Ehrlichkeit. Anthropic beschreibt ein allgemeines Problem von KI-Modellen so, dass sie manchmal voreilig Schlüsse zögen und selbstbewusst Fortschritte behaupteten, obwohl die Beweislage dünn sei.

Opus 4.8 soll genau das besser machen. Laut Anthropic ist das Modell rund viermal seltener als sein Vorgänger dabei, Fehler in selbstgeschriebenem Code unkommentiert durchzulassen. Frühe Tester berichten, das Modell weise häufiger auf eigene Unsicherheiten hin und stelle weniger unbelegte Behauptungen auf. Für den praktischen Einsatz – gerade bei langen, autonomen Arbeitsabläufen – ist das potenziell wichtiger als ein paar Prozentpunkte mehr in einem Benchmark: Ein Modell, das seine eigenen Schwächen meldet, erzeugt weniger stille Fehler, die ein Mensch später mühsam aufspüren muss.

Bemerkenswert ist die Einordnung des Alignment-Teams von Anthropic: Opus 4.8 erreiche neue Höchstwerte bei "prosozialen" Eigenschaften wie der Unterstützung der Nutzerautonomie. Raten für unerwünschtes Verhalten wie Täuschung oder Kooperation mit Missbrauch seien substanziell niedriger als bei Opus 4.7 – und vergleichbar mit Claude Mythos Preview, dem nach eigener Aussage am besten ausgerichteten Modell des Unternehmens. Eine begleitende Studie zu KI-Agenten, die simulierte Städte betrieben, ging viral – dort waren Claudes Agenten unter allen Modellen am wenigsten geneigt, "Verbrechen" zu begehen. Wer sich für solche Verhaltensexperimente interessiert, findet bei uns die Geschichte vom KI-Radio-Experiment, bei dem vier KI-Modelle eigene Radiosender betrieben.

Die Benchmark-Zahlen im Detail

Anthropic gibt an, Opus 4.8 schlage in den meisten Benchmarks sowohl den Vorgänger Opus 4.7 als auch OpenAIs GPT-5.5 und Googles Gemini 3.1 Pro. Die offiziell veröffentlichten Werte im Vergleich zu Opus 4.7:

  • Agentic Coding (Terminal-Bench 2.1): von 64,3 auf 69,2 Prozent
  • Multidisziplinäres Reasoning mit Tools: von 54,7 auf 57,9 Prozent
  • Agentic Computer Use: von 82,8 auf 83,4 Prozent
  • Knowledge Work: von 1.753 auf 1.890 Punkte
  • Long-Context-Retrieval bei 1 Million Token: 68,1 Prozent (gegenüber 40,3 Prozent bei Opus 4.7) – einer der größten Einzelsprünge

Eine wichtige Einordnung zur Fairness: Bei einem Benchmark, dem agentischen Terminal-Coding, bleibt laut The New Stack OpenAIs GPT-5.5 vorn. Und wie immer bei Hersteller-Benchmarks am Tag der Veröffentlichung gilt: Die Zahlen stammen von Anthropic selbst, unabhängige Langzeit-Tests können ein anderes Bild zeichnen. Anthropic hat zudem transparent gemacht, dass es die Messmethode eines Benchmarks (OSWorld-Verified) angepasst und den Vergleichswert des Vorgängers entsprechend nach oben korrigiert hat – ein Detail, das man bei der Bewertung der Steigerung kennen sollte.

Die neuen Features – teils wichtiger als das Modell selbst

Mehrere Beobachter, darunter The Decoder, weisen darauf hin, dass die zusammen mit dem Modell veröffentlichten Funktionen möglicherweise relevanter sind als das Modell-Update selbst. Drei Neuerungen stechen heraus:

Dynamic Workflows (Research Preview): Das ist die größte Neuerung. Das Modell kann eine Aufgabe planen und anschließend Hunderte paralleler Subagenten in einer einzigen Sitzung starten. Anthropic gibt an, Claude Code mit Opus 4.8 könne damit Migrationen über ganze Codebasen mit Hunderttausenden Zeilen Code durchführen – von der Planung bis zum fertigen Merge, mit der bestehenden Test-Suite als Qualitätsmaßstab. Die Funktion ist auf den Enterprise-, Team- und Max-Plänen verfügbar.

Effort Control (Aufwandssteuerung): In claude.ai und der Anwendung Cowork können Nutzer nun selbst wählen, wie viel "Aufwand" das Modell in eine Antwort steckt. Höherer Aufwand bedeutet mehr Token und bessere Ergebnisse, niedrigerer Aufwand schnellere Antworten und langsameren Verbrauch der Nutzungskontingente. Das adressiert ein praktisches Bedürfnis: Kunden suchen zunehmend nach Wegen, KI kostenbewusster einzusetzen.

Günstigerer Fast Mode: Der Schnellmodus arbeitet mit 2,5-facher Geschwindigkeit und ist nun rund dreimal günstiger als bei den Vorgängermodellen. Für Entwickler relevant: Die Messages API akzeptiert jetzt System-Einträge innerhalb des Nachrichten-Arrays, sodass sich Claudes Anweisungen mitten in einer Aufgabe aktualisieren lassen, ohne den Prompt-Cache zu sprengen.

Preis und Verfügbarkeit

Hier gibt es eine klare Nachricht: Der Preis für die reguläre Nutzung bleibt unverändert gegenüber Opus 4.7 – 5 US-Dollar pro Million Input-Token und 25 US-Dollar pro Million Output-Token. Das Modell ist ab sofort überall verfügbar, also in claude.ai, in Claude Code und über die API. Diese "gleicher Preis, mehr Leistung"-Linie zieht sich durch die gesamte Opus-4.x-Reihe und ist ein bewusstes Signal an Geschäftskunden.

Die kritische Einordnung: kein Game-Changer

Bei aller Verbesserung ist Ehrlichkeit auch hier angebracht – und Anthropic liefert sie selbst. Das Unternehmen nennt Opus 4.8 ausdrücklich eine "bescheidene, aber spürbare Verbesserung". Das Tech-Magazin Gizmodo ordnet ein, Nutzer würden eine spürbare Verbesserung bemerken, besonders bei größeren Coding-Aufgaben, es sei aber "kein Game-Changer". Gizmodo erinnert zudem daran, dass der Vorgänger Opus 4.7, der erst gut einen Monat zuvor erschien, bei einigen Nutzern eine "verhaltene" frühe Reaktion erntete – unter anderem, weil seine "adaptive Denkweise" manchmal zu viel Zeit auf eigentlich einfache Aufgaben verwendete.

Diese Einordnung ist wichtig: Opus 4.8 ist ein solides, inkrementelles Update mit einem klugen Schwerpunkt (Ehrlichkeit) und einigen praktisch nützlichen Features – aber keine Revolution. Wer einen dramatischen Leistungssprung erwartet, wird ihn nicht finden. Wer Wert auf zuverlässigere, weniger fehleranfällige Zusammenarbeit legt, durchaus.

Was als Nächstes kommt: die Mythos-Klasse

Der vielleicht spannendste Teil der Ankündigung betrifft die Zukunft. Anthropic kündigte zwei Entwicklungslinien an:

Erstens: günstigere Modelle mit Opus-Niveau. Das Unternehmen arbeitet an Modellen, die die Fähigkeiten von Opus 4.8 zu niedrigeren Kosten bieten – ein wichtiges Signal für alle, denen die aktuellen Preise zu hoch sind. Branchenbeobachter spekulieren bereits über ein mögliches "Sonnet 4.8" in dieser Rolle.

Zweitens, und gewichtiger: die Mythos-Klasse. Anthropic plant eine neue Modellklasse mit höherer Intelligenz als Opus, basierend auf der Claude-Mythos-Architektur. Das Unternehmen erwartet, Mythos-Klasse-Modelle "in den kommenden Wochen" allen Kunden zugänglich zu machen – sobald alle Sicherheitsmaßnahmen getroffen sind.

Genau dieser Sicherheitsvorbehalt ist bedeutsam. Wir haben über das Mythos-Modell bereits ausführlich berichtet: Eine erste Vorschau hatte im Vormonat erhebliche Cybersicherheits-Bedenken ausgelöst, weshalb Anthropic das Modell bewusst zurückhielt. Aktuell ist Claude Mythos Preview nur in begrenztem Zugang verfügbar – eine kleine Zahl von Organisationen nutzt es im Rahmen von "Project Glasswing" für Cybersicherheitsarbeit. Dabei hat das Modell laut Anthropic bereits über 10.000 kritische Software-Schwachstellen gefunden. Die Hintergründe und warum dieses Modell EZB, IWF und das Weiße Haus beschäftigt hat, haben wir in unserer Analyse zu Anthropics Claude Mythos aufgearbeitet.

Dass Opus 4.8 in seinen Alignment-Werten bereits nahe an Mythos Preview heranreicht, deutet darauf hin, dass Anthropic die Sicherheitsarbeit, die für die Mythos-Freigabe nötig ist, schrittweise in die regulären Modelle einfließen lässt.

Der Hintergrund: das IPO-Rennen

Die Veröffentlichung fällt in einen bemerkenswerten Kontext. Anthropic hat zeitgleich eine Finanzierungsrunde (Series H) über 65 Milliarden US-Dollar bei einer Bewertung von 965 Milliarden US-Dollar bekanntgegeben. Sowohl Anthropic als auch der Erzrivale OpenAI bereiten Börsengänge für dieses Jahr vor. In diesem Umfeld ist ein regelmäßiger Strom an Modell-Updates und Benchmark-Bestwerten auch ein Signal an Investoren – ein Aspekt, den man bei der Bewertung der Ankündigungsdichte mitdenken sollte.

Realistisches Fazit

Claude Opus 4.8 ist kein spektakuläres, aber ein durchdachtes Update. Der Schwerpunkt auf Ehrlichkeit – ein Modell, das seine eigenen Fehler und Unsicherheiten offener kommuniziert – adressiert ein reales Problem im praktischen KI-Einsatz und ist möglicherweise wertvoller als der moderate Benchmark-Zuwachs. Die neuen Features, allen voran Dynamic Workflows mit parallelen Subagenten, könnten für professionelle Anwender mehr Wirkung entfalten als das Modell-Update selbst.

Anthropic positioniert sich damit weiter klar im Spitzenfeld, das es sich im Geschäftskundenmarkt erarbeitet hat. Ob diese Position hält, wird sich entscheiden, wenn die Mythos-Klasse breit verfügbar wird – mit höherer Intelligenz, aber auch neuen Sicherheitsauflagen. Die nächsten Wochen werden also interessanter als dieses solide, aber bewusst zurückhaltend angekündigte Update. Für Nutzer, die das Modell heute einsetzen, ist die wichtigste Nachricht schlicht: mehr Verlässlichkeit zum gleichen Preis.

Wer den breiteren Vergleich der großen Modelle sucht, findet ihn in unserem Überblick zu Claude, GPT und Gemini.

Häufig gestellte Fragen (FAQ)

Was ist Claude Opus 4.8?

Claude Opus 4.8 ist das am 28. Mai 2026 veröffentlichte Spitzenmodell des KI-Unternehmens Anthropic. Es ist ein Upgrade von Opus 4.7 und legt den Schwerpunkt auf "Ehrlichkeit" – das Modell soll seine eigenen Fehler und Unsicherheiten offener kommunizieren und ist laut Anthropic in mehreren Benchmarks führend.

Was ist der wichtigste Unterschied zu Opus 4.7?

Der zentrale Unterschied ist die verbesserte Ehrlichkeit: Opus 4.8 lässt laut Anthropic rund viermal seltener Fehler im selbstgeschriebenen Code unkommentiert durch. Dazu kommen Benchmark-Verbesserungen (etwa Agentic Coding von 64,3 auf 69,2 Prozent) und ein deutlich besseres Long-Context-Retrieval (68,1 statt 40,3 Prozent bei 1 Million Token).

Was kostet Claude Opus 4.8?

Der Preis für die reguläre Nutzung bleibt unverändert gegenüber Opus 4.7: 5 US-Dollar pro Million Input-Token und 25 US-Dollar pro Million Output-Token. Der schnellere Fast Mode ist sogar rund dreimal günstiger als bei den Vorgängermodellen.

Was sind Dynamic Workflows?

Dynamic Workflows ist ein neues Feature (zunächst als Research Preview), das es Claude erlaubt, eine Aufgabe zu planen und dann Hunderte paralleler Subagenten in einer Sitzung zu starten. Damit kann Claude Code etwa Migrationen über ganze Codebasen mit Hunderttausenden Zeilen Code von der Planung bis zum Merge durchführen. Verfügbar auf Enterprise-, Team- und Max-Plänen.

Was ist die Effort Control?

Die Effort Control (Aufwandssteuerung) erlaubt Nutzern in claude.ai und Cowork, selbst zu bestimmen, wie viel Rechenaufwand Claude in eine Antwort steckt. Höherer Aufwand liefert bessere Ergebnisse bei höherem Token-Verbrauch, niedrigerer Aufwand schnellere Antworten. Das hilft, KI kostenbewusster einzusetzen.

Ist Opus 4.8 ein großer Sprung?

Nein, und das sagt Anthropic selbst: Das Unternehmen nennt es eine "bescheidene, aber spürbare Verbesserung". Auch unabhängige Medien wie Gizmodo bezeichnen es als solides Update, aber "keinen Game-Changer". Der Wert liegt eher in der höheren Verlässlichkeit und den neuen Features als in einem dramatischen Leistungssprung.

Was ist die Mythos-Klasse und wann kommt sie?

Die Mythos-Klasse ist eine angekündigte neue Modellklasse mit höherer Intelligenz als Opus, basierend auf der Claude-Mythos-Architektur. Anthropic erwartet, sie "in den kommenden Wochen" allen Kunden zugänglich zu machen, sobald die Sicherheitsmaßnahmen abgeschlossen sind. Aktuell ist Claude Mythos Preview nur in begrenztem Zugang für Cybersicherheitsarbeit (Project Glasswing) verfügbar.

Warum wird Claude Mythos so vorsichtig behandelt?

Eine erste Vorschau der Mythos-Klasse hatte erhebliche Cybersicherheits-Bedenken ausgelöst, da das Modell sehr leistungsfähig bei der Entdeckung von Software-Schwachstellen ist – bereits über 10.000 kritische Schwachstellen wurden im Rahmen von Project Glasswing gefunden. Anthropic hält die breite Freigabe deshalb zurück, bis ausreichende Sicherheitsmaßnahmen getroffen sind.

Quellen: