OpenAI lanciert GPT-5.4 – Neues Modell vereint logisches Denken und Programmierung

KI-News

OpenAI launcht GPT-5.4: Fortschritt in logischem Denken, Programmierung und nativer Computersteuerung

Lesezeit: ca. 12 Minuten

Key Takeaways

  • GPT-5.4 vereint erstmals logisches Denken, ausgeprägte Programmierfähigkeiten und native Computersteuerung in einem Modell.
  • Mit der neuen „Thinking“-Funktion macht ChatGPT den Denkprozess sichtbar – Nutzer*innen können aktiv in die Argumentationskette eingreifen.
  • Die neue API-Funktion „Tool Search“ reduziert den Token-Verbrauch erheblich, während die Grundpreise für Entwickler gleichzeitig gestiegen sind.
  • GPT-5.4 erreicht im ARC-AGI-1 Benchmark einen Wert von 93,7 Prozent; das Pro-Modell liegt bei 94,5 Prozent.
  • Wegen fortschrittlicher Automatisierungs-Features in der Cybersicherheit wird GPT-5.4 als „High Capability“-Modell eingestuft und durch ein zweistufiges Sicherheitssystem überwacht.

OpenAI stellt GPT-5.4 und GPT-5.4 Pro vor

OpenAI veröffentlicht mit GPT-5.4 und der leistungsstärkeren Variante GPT-5.4 Pro eine neue Modellgeneration, die mehrere bislang getrennte Fähigkeiten erstmals in einer einzigen KI kombiniert. Die Architektur integriert logisches Denken, die erweiterten Coding-Skills aus dem kürzlich eingeführten Codex-5.3 und hebt die Computersteuerung auf ein natives Level: Desktop-Bedienung, automatisiertes Testen und Value Extraction werden künftig KI-nativ mit einer Schnittstelle abgebildet.

GPT-5.4 Thinking: Transparenter Denkprozess erstmals sichtbar

In der überarbeiteten Benutzeroberfläche von ChatGPT arbeitet das „GPT-5.4 Thinking“-System. Anders als bei bisherigen Modellen bleibt der Rechenvorgang nicht verborgen, sondern die KI erstellt zu Beginn komplexer Aufgaben einen gut lesbaren, strukturierten Denkplan. Nutzer sehen die Zwischenschritte live und können korrigierend eingreifen. Wenn GPT-5.4 einen Fehlansatz wählt – ob in Logik oder Code – kann mittels Anpassung dieses Plans interveniert werden, bevor eine endgültige Antwort oder Lösung erfolgt. Ein kompletter neuer Prompt ist nicht mehr nötig, was die Interaktion deutlich beschleunigt und Fehlerquellen minimiert.

Diese Interaktivität senkt die Schwelle, KI für Routine- und Spezialaufgaben im Alltag sowie in professionellen Kontexten einzusetzen. Sie macht die Arbeitsweise des Modells nachvollziehbar, bietet Transparenz in der Lösungsfindung und verbessert die Nachsteuerbarkeit der Resultate.

Neue API-Features: Tool Search und effizientes Funktionieren

Für Entwickler bietet die GPT-5.4-API mit „Tool Search“ eine zentrale Neuerung: Bislang mussten in Prompts alle externen Funktionsdefinitionen vorab geladen werden, was hohen Speicherplatz- und Token-Verbrauch verursachte. Das neue Verfahren übergibt GPT-5.4 nun lediglich eine kurze Funktionsliste; die genaue Definition zieht sich das Modell erst zum Zeitpunkt der konkreten Nutzung.

OpenAI gibt an, dass dieser Ansatz in Tests den Token-Verbrauch nahezu halbierte. Anwendungen profitieren damit nicht nur von niedrigeren Kosten, sondern auch von schlankeren, effizienteren Abläufen. Vor allem bei umfangreichen Workflows mit vielen Tools und Spezialfunktionen verschaffen sich Entwickler einen deutlichen Vorteil.

Agenten: Automatisierte Computersteuerung durch GPT-5.4

GPT-5.4 führt native Computersteuerung ein. Autonome KI-Agenten agieren direkt im Betriebssystem-Umfeld, steuern per Simulation von Maus und Tastatur verschiedene Desktop-Anwendungen und interagieren visuell mit dem System. Ein neuer Bilddetail-Modus macht es möglich, Grafiken mit einer Auflösung bis zu 10,24 Megapixel nativ auszulesen. So kann die KI etwa Benutzeroberflächen erkennen, Werte ablesen oder Steuerelemente gezielt bedienen.

Demonstriert wird diese Technologie durch den experimentellen KI-Skill „Playwright“. In einer ausführlichen Vorführung erschuf der KI-Agent nach einfachem Prompt eine vollständige isometrische Freizeitpark-Simulation – inklusive Wegfindungs-Logik für simulierte Besucher.

Für die Arbeit an langen, ineinandergreifenden Aufgaben unterstützt GPT-5.4 die Verarbeitung von bis zu eine Million Token in einem Kontext. Dadurch bleibt der Inhalt komplexer Prozesse auch über Stunden hinweg konsistent abrufbar.

Leistungsdaten und Benchmarks: Branchenspezifische Fortschritte

GPT-5.4 und GPT-5.4 Pro überzeugen in mehreren offiziellen Benchmarks durchgängig mit starken Ergebnissen:

  • ARC-AGI-1-Benchmark: GPT-5.4 erreicht im abstrakten Problemlösen 93,7 Prozent, die Pro-Version 94,5 Prozent.
  • GDPval: Im OpenAI-interntesten Benchmark, der komplexe Aufgaben aus 44 Berufsfeldern abdeckt, erzielt GPT-5.4 einen Wert von 83 Prozent – interessanterweise besser als die Pro-Version.
  • Investment Banking: Das Modell erreicht eine Erfolgsquote von 87,3 Prozent.
  • SWE-Bench Pro (Coding): GPT-5.4 löst 57,7 Prozent der Aufgaben bei einer mittleren Latenz von etwa 1000 Sekunden. Ein zusätzlicher Schnellmodus des Codex steigert die Geschwindigkeit um 50 Prozent, ohne die Lösungsqualität zu beeinträchtigen.

Für professionelle Anwender, insbesondere im Enterprise-Bereich, gibt es ein neues ChatGPT-Add-in für Excel, um Daten und Tabellen direkt mit KI-Unterstützung zu verarbeiten.

Sicherheit und „High Capability“-Einstufung

Ein zentrales Element beim Launch von GPT-5.4 ist laut System Card das Sicherheitskonzept. Das Modell zählt zur Kategorie „High Capability“ – als erstes allgemeines Reasoning-Modell erhält es diese hohe Einstufung im Bereich Cybersicherheit.

Konkret erkennt OpenAI, dass GPT-5.4 potentiell gesamte End-to-End-Cyberangriffe automatisieren kann oder in der Lage wäre, relevante Schwachstellen selbständig zu identifizieren und auszunutzen. Die KI könnte kritische Infrastruktur gezielt adressieren. Um Missbrauch zu verhindern, greift ein angepasstes Schutzsystem: Jede Eingabe und Ausgabe wird durch ein zweistufiges Überwachungssystem geprüft.

Bei kritischen Prompts oder bösartigem Code unterbricht ein Echtzeit-Blocker sofort die Modellantwort. Eine simple Herabstufung auf weniger leistungsfähige Modelle entfällt zugunsten dieses granularen Prüfmechanismus.

Preise für Entwickler:innen: GPT-5.4 und GPT-5.4 Pro

Die Nutzung der neuen Funktionen ist ab sofort möglich – die Preisstruktur unterscheidet deutlich zwischen Standard- und Pro-Modell:

  • GPT-5.4 Standard: 2,50 US-Dollar pro 1 Million Input-Token, 15,00 US-Dollar pro 1 Million Output-Token. Wird Input-Caching genutzt, sinkt der Input-Preis auf 0,25 US-Dollar.
  • GPT-5.4 Pro: Für rechenintensive Unternehmensanwendungen werden 30,00 US-Dollar (Input) und 180,00 US-Dollar (Output) pro 1 Million Token berechnet.

OpenAI begründet die gestiegenen Token-Preise mit der größeren Effizienz der Modelle: Durch sparsameren Umgang mit Token soll die tatsächliche Abrechnung in der Praxis nicht übermäßig steigen.

Fazit

Mit GPT-5.4 stellt OpenAI eine neue Generation von KI-Modellen vor, die nicht nur in Benchmarks, sondern auch in grundlegend neuen Einsatzszenarien überzeugt. Die sichtbaren Denkprozesse, clevere Ressourcenverwaltung und native Computersteuerungs-Agenten markieren einen Schritt in Richtung echter Generalisten-KI – und setzen neue Sicherheitsstandards.

Diskutieren Sie mit: Wie bewerten Sie die Öffnung komplexer KI-Prozesse für Nutzereingriffe und den Schwerpunkt auf Cybersicherheit? Welche Implikationen sehen Sie für den Einsatz in Unternehmen und bei der Automatisierung alltäglicher Aufgaben?

Bildquelle: https://www.all-ai.de/news/news26top/gpt-5-4-neu

What do you feel about this post?

0%
like

Like

0%
love

Love

0%
happy

Happy

0%
haha

Haha

0%
sad

Sad

0%
angry

Angry

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert