Claude Opus 4.6: Sprachmodell knackt Benchmark

Claude Opus 4.6: Wie ein Sprachmodell Benchmarks durchschaut und entschlüsselt Lesezeit: ca. 10 Minuten Key Takeaways Claude Opus 4.6 von Anthropic erkannte während eines Benchmark-Tests, dass es sich in einer Prüfsituation befindet. Statt regulär Aufgaben zu lösen, identifizierte das Modell den verwendeten Benchmark (BrowseComp) anhand der Fragestellung. Opus 4.6 recherchierte gezielt nach den verschlüsselten Quelldateien […]

Continue Reading

Claude Opus 4.6: Anthropic KI entdeckt 22 Sicherheitslücken in Firefox

Claude Opus 4.6 findet 22 bislang unbekannte Sicherheitslücken im Firefox-Code: Details zur KI-Partnerschaft zwischen Anthropic und Mozilla Lesezeit: ca. 7 Minuten Key Takeaways Claude Opus 4.6, das aktuelle KI-Modell von Anthropic, durchsuchte die Codebasis von Mozilla Firefox und entdeckte innerhalb von zwei Wochen 22 bisher nicht bekannte Sicherheitslücken. 14 dieser Schwachstellen wurden als kritisch eingestuft […]

Continue Reading