Anthropic veröffentlicht Claude Opus 4.8
Anthropic hat Claude Opus 4.8 veröffentlicht – ein Update, das vor allem bei agentenbasierten Aufgaben punkten soll: Das Modell erkenne eigene Fehler im Code viermal zuverlässiger als sein Vorgänger und soll seltener unbegründete Behauptungen über den Fortschritt seiner Arbeit machen.
Anthropic hat eine neue Version seines leistungsstärksten KI-Modells vorgestellt. Claude Opus 4.8 löst den Vorgänger Opus 4.7 ab und soll laut Hersteller vor allem in agentenbasierten Aufgaben zuverlässiger und präziser urteilen. Der Preis bleibt unverändert: Entwickler zahlen weiterhin fünf Dollar pro Million Eingabe-Token und 25 Dollar pro Million Ausgabe-Token über die Claude API.
Ehrlicher und sozialer
Ein zentrales Verkaufsargument ist die verbesserte Ehrlichkeit des Modells. Anthropic gibt an, Opus 4.8 sei rund viermal seltener als sein Vorgänger dazu neigt, Fehler im selbst generierten Code stillschweigend zu übergehen. Das interne Alignment-Team bescheinigt dem Modell zudem neue Bestwerte bei prosozialem Verhalten, darunter die Unterstützung der Nutzerautonomie und das Handeln im Interesse der Nutzenden. Die Rate sogenannter "misaligned behaviors" – also Täuschung oder Kooperation mit Missbrauch - soll deutlich unter dem Niveau von Opus 4.7 liegen und sich dem bislang am stärksten auf Sicherheit ausgerichteten Modell Claude Mythos Preview annähern.
Neben dem neuen Modell führt Anthropic mehrere Zusatzfunktionen ein. In Claude Code, dem KI-gestützten Entwicklertool des Unternehmens, erscheinen sogenannte "Dynamic Workflows" als Research Preview: Das System kann dabei Hunderte parallele Subagenten in einer einzigen Sitzung koordinieren und so etwa groß angelegte Code-Migrationen über Hunderttausende Zeilen vollständig automatisiert durchführen. Die Funktion steht zunächst für Enterprise-, Team- und Max-Pläne bereit. Zusätzlich können Nutzer auf claude.ai jetzt die Bearbeitungsintensität des Modells selbst steuern: Wer schnellere Antworten bevorzugt, wählt eine geringere Effort-Stufe; wer höchste Qualität erwartet, greift auf "Extra" oder "Max" zurück.
Laufende Aktualisierung von Agenten
Technisch erweitert Anthropic außerdem die Messages API: Entwickler können ab sofort Systeminstruktionen innerhalb des Nachrichten-Arrays platzieren, ohne den Prompt-Cache zu unterbrechen. Das erleichtert es, laufende Agenten-Prozesse mit aktualisierten Berechtigungen oder Kontextinformationen zu versorgen. Der schnelle Betriebsmodus von Opus 4.8 arbeitet laut Hersteller mit 2,5-facher Geschwindigkeit und ist im Vergleich zu Vorgängermodellen dreimal günstiger, kostet nun also zehn Dollar pro Million Eingabe-Token und 50 Dollar pro Million Ausgabe-Token.
Einen Blick in die weitere Roadmap gibt Anthropic ebenfalls: Unter dem Namen "Project Glasswing" erprobt eine kleine Gruppe von Organisationen bereits Claude Mythos Preview für Cybersicherheitsanwendungen. Modelle dieser Leistungsklasse erfordern nach Unternehmensangaben zusätzliche Sicherheitsmechanismen, bevor sie breit verfügbar werden. Anthropic kündigt an, in den kommenden Wochen entsprechende Schutzmaßnahmen fertigzustellen und Mythos-Klasse-Modelle dann allen Kunden zugänglich zu machen.