Anthropic Claude Sonnet 4.5: Bestes Coding-Modell?

Anthropic hat Claude Sonnet 4.5 als das beste Coding-Modell der Welt vorgestellt. Das Modell soll sich besonders gut für komplexe Agenten und die Computernutzung eignen. Parallel wurden neue Entwicklerwerkzeuge veröffentlicht.

Claude Sonnet 4.5 erzielt einen Wert von 77,2 % auf SWE-bench Verified, einem Benchmark für reale Software-Coding-Fähigkeiten. Mit zusätzlicher Rechenleistung steigt der Wert auf 82 %. Zum Vergleich: Claude Opus 4.1 erreichte 74,5 %, Claude 4 72,7 % und GPT-5 72,8 %.

Auf dem OSWorld-Test, der die Fähigkeiten von KI-Modellen bei realen Computeraufgaben testet, führt Sonnet 4.5 mit 61,4 %. Das ist ein Anstieg gegenüber dem vorherigen Sonnet 4 Modell, das 42,2 % erreichte. Anthropic gibt an, dass das Modell erhebliche Verbesserungen im Bereich Reasoning und Mathematik aufweist.

Zu den weiteren Verbesserungen und Funktionen gehören Claude Code Updates mit Checkpoints, eine aktualisierte Terminaloberfläche und eine Visual Studio Code-Erweiterung. Die Claude API bietet Kontextbearbeitung und ein Memory-Tool für längere Aufgaben.

Es gibt jetzt auch Claude Apps für Codeausführung und Dateierstellung direkt in der Konversation sowie ein Claude Agent SDK für Entwickler zum Erstellen von KI-Agenten mit Systemen für Speichermanagement, Berechtigungen und Koordination.

Das Modell kann sich über 30 Stunden auf komplexe, mehrstufige Coding-Aufgaben konzentrieren. Außerdem wurden Verbesserungen in Bezug auf Sicherheit erzielt.

Sonnet 4.5 unterstützt bis zu 64K Output Token. Das Modell ist über die Claude API zum gleichen Preis wie das vorherige Sonnet 4 verfügbar: 3 US-Dollar pro 1 Million Input-Token und 15 US-Dollar pro 1 Million Output-Token.

Das Modell wird im Rahmen des AI Safety Level 3 Framework von Anthropic veröffentlicht, das Filter zur Begrenzung schädlicher oder riskanter Inhalte umfasst.