NCA Social Media
Grüner Browser mit CODEX Schriftzug und Rakete auf dunklem Hintergrund

Was ist Codex?

Codex ist die KI Coding Agent Plattform von OpenAI. Sie besteht aus drei Komponenten: einer Open Source CLI (Apache 2.0 Lizenz), einer nativen Desktop App für macOS und Windows sowie einer Cloud Variante in ChatGPT. Codex schreibt Features, beantwortet Fragen zur Codebase, fixt Bugs und schlägt Pull Requests vor. Im April 2026 nutzen rund 3 bis 4 Millionen Entwickler Codex wöchentlich.

Hinter dem aktuellen Codex steht GPT 5.3 Codex, das im Februar 2026 als bislang fähigstes agentisches Coding Modell von OpenAI veröffentlicht wurde. Es führt SWE Bench Pro und Terminal Bench 2.0 an und arbeitet 25 Prozent schneller als der Vorgänger GPT 5.2 Codex. Codex CLI ist nicht zu verwechseln mit der alten Codex API von 2021 bis 2023, die Plattform wurde im April 2025 als komplett neues Produkt gestartet.

Codex steht im direkten Wettbewerb zu Claude Code von Anthropic und zum Open Source Agent OpenCode. Die Plattform hat sich seit der April 2026 Erweiterung um Computer Use, In App Browser, Skills, Plugins und Memory von einem reinen Code Editor zu einem Agent Workspace für lange laufende Engineering Aufgaben entwickelt.

Codex mit NCA: Schnelle Hilfe vom Experten

NCA arbeitet seit Jahren mit KI Coding Agents im eigenen Production Stack und kennt das gesamte Ökosystem. Während wir intern Claude Code und OpenCode einsetzen, beobachten wir Codex genau und ordnen die Plattform für Teams ein, die zwischen den großen Agent Anbietern abwägen. Diese editorial Perspektive ist bewusst gewählt: Wir empfehlen kein Tool für Production, das wir nicht selbst täglich einsetzen.

Wir helfen Teams bei der Auswahl des passenden KI Coding Agents im Vibe Coding Consulting, beim Aufsetzen produktiver Workflows mit Vibe Coding Best Practices, beim Risiko Management durch automatisierte Code Reviews und bei der Einrichtung sicherer Plugin Ökosysteme. Wer von Codex Cloud zu lokalen Modellen migrieren will, bekommt von uns einen Ollama gestützten Stack aus DSGVO konformer Eigenentwicklung. Bei laufenden Projekten retten wir auch Vibe Coding Vorhaben mit KI Schäden im Code.

Lass uns sprechen

Finde das passende Angebot für dein Projekt

🤖

Hey! Ich bin CodeBot. Lass uns herausfinden, wie wir dein Projekt zum Fliegen bringen.

Was soll entstehen?

Codex CLI, Codex App und Codex Cloud im Überblick

Codex ist heute kein einzelnes Tool, sondern eine Plattform mit drei Zugängen, die OpenAI parallel entwickelt. Wer Codex bewertet, sollte zuerst entscheiden, welcher Zugang für den eigenen Use Case relevant ist.

Codex CLI ist der Open Source Terminal Agent, der im April 2025 startete. Apache 2.0 lizenziert, läuft lokal, liest und ändert das Repository, führt Tests aus, committet. Konzeptionell vergleichbar mit Claude Code. Stärken laut Benchmarks: 3 bis 4 fach geringerer Token Verbrauch pro Task, 200K Context Window, höhere Werte auf Terminal Bench 2.0. TOML basierte MCP Konfiguration. Skill Support seit Dezember 2025 über SKILL.md Dateien in ~/.agents/skills/.

Codex App startete als macOS Desktop App am 2. Februar 2026, Windows Support folgte am 4. März 2026 mit nativem Sandbox statt WSL Zwang. Die App ist seit dem 16. April 2026 zum Agent Workspace ausgebaut: Computer Use für hintergründige Bedienung anderer Apps, In App Browser für UI Tests und Frontend Iteration, Bildgenerierung über gpt image 1.5 für Mockups, über 90 Plugins für Atlassian Rovo, GitLab Issues, CircleCI, CodeRabbit und mehr. Die App teilt CLI Skills und Konfiguration, ergänzt aber Worktrees, Multi Terminal, GitHub PR Reviews und SSH zu Remote Devboxes.

Codex Cloud ist die Variante in ChatGPT, in der OpenAI Tasks asynchron in eigenen Cloud Sandboxes ausführt. Jeder Task läuft in einer isolierten Umgebung mit dem geladenen Repository und kann parallel zu anderen Tasks arbeiten. Sinnvoll für Refactorings, Test Erweiterungen oder PR Drafts, die im Hintergrund laufen sollen, während Entwickler an anderen Aufgaben arbeiten.

Die vier Codex Levels: vom Single Turn zur Automation

Codex hat sich seit dem ersten CLI Launch durch vier klar unterscheidbare Stufen autonomen Arbeitens entwickelt. Welches Level für ein Vorhaben passt, hängt von Aufgabenkomplexität, Vertrauen ins Modell und vorhandener Verifikations Infrastruktur ab. Die Tabelle und die Infografik zeigen die gleiche Information visuell und textuell, damit auch Screenreader Nutzer den vollständigen Inhalt erhalten.

Level Plattform und Befehle Eigenschaft
Turn: Einzelner Prompt Codex CLI, Codex App, ChatGPT Eine Antwort pro Eingabe, klassische Pair Programming Logik
Session: Mehrere Turns Codex CLI mit Resume, Codex App Threads Gemeinsamer Kontext über mehrere Turns, manuell gesteuert
Goal: Long Horizon Codex CLI v0.128.0 mit /goal Persistentes Ziel, Codex arbeitet bis Fertigstellung oder Token Budget
Auto: Automation Codex Cloud Automations, Memory Wiederkehrende Aufgaben über Tage und Wochen, geplante Wakeups
Aufsteigendes Säulendiagramm der vier Codex Phasen Turn, Session, Goal, Auto. Inhalt steht textuell in der Tabelle darüber.

Goal Befehl: Long Horizon Coding mit Codex CLI

Mit Codex CLI Version 0.128.0 hat OpenAI Ende April 2026 das /goal Feature eingeführt. Es ist die OpenAI Antwort auf den Ralph Loop und auf Claude Agent Teams: Ein persistentes Ziel überlebt Token Budget, Pausen und Session Wechsel, bis Codex es als erfüllt evaluiert oder das Budget aufgebraucht ist.

Der Befehl Workflow ist bewusst minimal gehalten und in der CLI über fünf Subcommands abgebildet. Goals sind aktuell hinter einem Feature Flag versteckt, OpenAI rollt sie schrittweise aus.

Code:
          

/goal <objective> # Ziel erstellen oder ersetzen
/goal # Status anzeigen
/goal pause # Aktives Ziel pausieren
/goal resume # Pausiertes Ziel fortsetzen
/goal clear # Ziel komplett entfernen

Wenn Codex einen Turn beendet hat, das Ziel aber nicht erreicht ist, arbeitet die CLI eigenständig weiter. Wer Strg C drückt oder eine neue Eingabe sendet, pausiert das Ziel automatisch. Erreicht Codex das Token Budget, wechselt es in einen budget limited Status: Statt abrupt zu stoppen fasst der Agent den Fortschritt zusammen, notiert Offenes und speichert den Zustand für späteres Resume.

Sinnvolle Ziele sind verifizierbar formuliert: Migriere dieses Paket von v2 auf v3 API und validiere jeden Schritt oder erhöhe die Test Coverage bis alle kritischen Pfade abgedeckt sind. Schwammige Anweisungen wie verbessere die Codebase liefern weniger gute Ergebnisse, weil Codex keinen klaren Erfüllungs Anker findet. Die Stale Update Protection über goal_id verhindert Race Conditions, wenn mehrere Updates parallel passieren.

Wichtig für Production Teams: /goal reduziert nicht den Bedarf an menschlicher Kontrolle, sondern erhöht ihn. Der Agent arbeitet länger autonom und produziert mehr Code Änderungen, die geprüft werden müssen. Wir sehen automatisierte Code Reviews mit CodeRabbit und solide Vibe Coding Best Practices als Pflicht, sobald /goal eingesetzt wird.

Skills, Plugins, Computer Use und Browser: Codex als Agent Workspace

Im April 2026 hat OpenAI Codex von einem reinen Coding Tool zu einem breiteren Agent Workspace ausgebaut. Vier Erweiterungen prägen die Plattform seitdem.

Skills sind Markdown Dateien in ~/.agents/skills/, die Codex automatisch lädt, wenn der Task passt. Eine Skill enthält Anweisungen, die in jeder zukünftigen Session greifen, ohne dass das Team sie wiederholt. Konzeptionell ähnlich wie das Agent Skills Ökosystem von Vercel oder Claude Code Plugins, aber als OpenAI eigene Abstraktion.

Plugins bündeln Skills, App Integrationen und MCP Server in einer einzelnen Distributions Einheit. Mit dem April Update kamen über 90 neue Plugins für Atlassian Rovo, GitLab Issues, CircleCI, CodeRabbit, Microsoft Suite, Render, Neon und Remotion dazu. Plugins sind nicht nur API Wrapper, sondern als Verteilungs Surface für wiederverwendbare Team Workflows konzipiert.

Computer Use erlaubt Codex im Hintergrund mit dem eigenen Cursor andere Apps auf dem Mac zu bedienen. Mehrere Agents können parallel arbeiten, ohne den menschlichen Workflow zu blockieren. Aktuell nur macOS, EU und UK Rollout schrittweise. Auf Windows ist Computer Use noch nicht verfügbar.

In App Browser ist eine eingebaute Browser Komponente für Frontend Iteration und UI Tests. Entwickler können direkt in der Seite Kommentare hinterlassen, die Codex als Anweisung versteht. Das vervollständigt den Loop aus UI Check, Mockup, Asset Generierung über gpt image 1.5 und Code Änderung in einem einzigen Werkzeug.

GPT 5.3 Codex: das Modell hinter der Plattform

Seit dem 5. Februar 2026 läuft Codex auf GPT 5.3 Codex, dem laut OpenAI bislang fähigsten agentischen Coding Modell. Es kombiniert die Coding Stärken des Vorgängers GPT 5.2 Codex mit den Reasoning Fähigkeiten von GPT 5.2 in einem Modell und arbeitet 25 Prozent schneller. Der Sprung gegenüber dem Vorgänger ist dadurch praktisch fühlbar, gerade bei langen Tool Use Ketten.

Auf den relevanten Benchmarks setzt GPT 5.3 Codex aktuell den Industriestandard: SWE Bench Pro für reale Software Engineering Aufgaben, Terminal Bench 2.0 für Terminal Skills, OSWorld für Computer Bedienung und GDPval für reale Knowledge Work. SWE Bench Pro deckt vier Sprachen ab und ist anders als das ältere SWE bench Verified weniger anfällig für Trainingsdaten Kontamination, was die Aussagekraft erhöht.

Bemerkenswert ist die Token Effizienz: GPT 5.3 Codex erreicht die Spitzenwerte mit weniger Tokens als jedes vorherige Modell. Das ist im Pricing Modell von OpenAI direkt monetär spürbar und macht Token Monitoring über CodexBar für Heavy User trotzdem sinnvoll, besonders bei Sessions mit /goal.

Codex vs Claude Code: editorial Einordnung

Codex und Claude Code sind die beiden ernsthaftesten Terminal Coding Agents auf dem Markt. NCA setzt intern Claude Code ein, kennt aber den Stand von Codex aus eigener Evaluation und Community Beobachtung.

Stärken von Codex: Token Effizienz, höhere Werte auf Terminal Bench 2.0 (77,3 Prozent gegenüber 65,4 Prozent), persistentes /goal Feature für Long Horizon Aufgaben, breiteres Plugin Ökosystem mit über 90 Integrationen, Computer Use für App übergreifende Workflows, In App Browser für Frontend Iteration. Die Plattform ist sichtbar auf Workspace Skalierung und enterprise Workflows ausgerichtet.

Stärken von Claude Code: höhere Werte auf SWE Bench Verified (80,8 Prozent), 1 Million Token Context Window bei aktuellen Modellen, reiferes Hook System für externe Skript Integration, planbare Kosten über Claude Max Subscription. In Community Diskussionen auf Hacker News und r/ClaudeAI kursiert der Eindruck, dass Claude Opus 4.7 bei komplexen Refactorings sauberer Code liefert, was subjektiv ist und sich schnell verschieben kann.

Pricing Vergleich: Claude Max kostet 200 Dollar pro Monat und deckt schwere Claude Code Nutzung ohne Überraschungen ab. Codex läuft über den ChatGPT Plan oder API Tokens, was schnell unerwartet teuer werden kann. Seit dem 30. April 2026 gibt es einen 100 Dollar Pro Plan speziell für lange, intensive Codex Sessions, der Plus Tier ist für stetige Tagesarbeit gedacht.

NCA Empfehlung für Teams: Wer ohnehin im OpenAI Ökosystem arbeitet, sollte Codex evaluieren, gerade wegen /goal und der App Integration. Wer primär PHP, Symfony oder komplexe Refactorings macht, fährt mit Claude Code aktuell stabiler. Beide Tools können sinnvoll parallel laufen. Ob Codex oder Claude Code für ein konkretes Team passt, klären wir im Vibe Coding Consulting.

NCA Erfahrung mit Codex: editorial bewertet, nicht in Production

NCA setzt Codex bewusst nicht im eigenen Production Stack ein. Unser KI Coding Stack basiert auf Claude Code und OpenCode als Terminal Agents, mit lokalen Modellen über Ollama wenn DSGVO Konformität verlangt wird. Diese Entscheidung beruht auf Stabilität, planbarer Subscription Kosten und tiefer Integration in unsere PHP und Symfony Workflows.

Trotzdem kennen wir Codex. Wir testen die Plattform regelmäßig in Vergleichsprojekten und beobachten die schnelle Entwicklung der Plattform. Was wir bei Kunden Engagements sehen: Teams, die bereits ChatGPT Plus oder Pro nutzen und im OpenAI Ökosystem zuhause sind, profitieren spürbar von der App Integration und den Plugins. Teams mit komplexen Backend Refactorings oder strengen Qualitätsanforderungen finden in Claude Code aktuell den ruhigeren Partner.

Bei Vibe Coding Risiken ist die Lage bei beiden Agents ähnlich: Mehr autonome Arbeit bedeutet mehr zu reviewenden Code. Für /goal Sessions empfehlen wir verbindliche automatische Code Reviews und klare Spec Driven Development Patterns, bevor das Feature breit ins Team gerollt wird.

CYPRESS.IO Ambassador und IT Consultant für QA Engenieering und Qualität in PHP Projekten.

NCA Vibe Coding Consulting

Roland Golla ist Entwickler aus Leidenschaft – seit über 20 Jahren. Er hat hunderte Projekte begleitet, von Legacy-Refactoring bis KI-Integration. Bei Vibe Coding verbindet er das Beste aus beiden Welten: Die Geschwindigkeit von KI-generiertem Code mit der Qualität professioneller Softwareentwicklung. Kein Bullshit, keine Agentur-Floskeln – direkte Hilfe von jemandem, der selbst täglich im Code steckt.

Häufige Fragen zu Codex

Die meistgestellten Fragen zu OpenAI Codex aus NCA Beratungsprojekten und Community Diskussionen, kompakt beantwortet.

Was ist Codex genau und für wen ist die Plattform 2026 gedacht?

Codex ist die KI Coding Agent Plattform von OpenAI mit drei Zugängen: Open Source CLI für das Terminal, native Desktop App für macOS und Windows sowie Codex Cloud in ChatGPT für asynchrone Tasks. Im April 2026 nutzen rund 3 bis 4 Millionen Entwickler Codex wöchentlich. Die Plattform richtet sich an Teams, die im OpenAI Ökosystem arbeiten und einen Agent für Coding plus Computer Use brauchen.

Wie funktioniert das goal Feature in Codex CLI 2026?

Das /goal Kommando in Codex CLI v0.128.0 erstellt ein persistentes Ziel, das Token Budget, Pausen und Sessions überlebt. Codex arbeitet eigenständig weiter, bis das Ziel als erfüllt evaluiert wird oder das Budget aufgebraucht ist. Subcommands sind /goal, /goal pause, /goal resume und /goal clear. Verifizierbar formulierte Ziele wie API Migrationen funktionieren besser als schwammige Anweisungen.

Welches Modell steckt 2026 hinter Codex?

Seit dem 5. Februar 2026 läuft Codex auf GPT 5.3 Codex, dem laut OpenAI bislang fähigsten agentischen Coding Modell. Es führt SWE Bench Pro und Terminal Bench 2.0 an, arbeitet 25 Prozent schneller als GPT 5.2 Codex und benötigt weniger Tokens als jedes vorherige Modell. Die Plattform routet automatisch zwischen Modellen je nach Task Komplexität.

Was kostet Codex 2026 und welche Pläne gibt es?

Codex läuft über die ChatGPT Subscription. Plus deckt stetige Tagesarbeit ab, der seit dem 30. April 2026 verfügbare 100 Dollar Pro Plan ist für lange, intensive Codex Sessions gedacht. Pro für 200 Dollar bleibt für Heavy User mit dauerhaft laufenden Agents. Daneben gibt es API Tokens, die unerwartet teuer werden können, wenn /goal lange läuft.

Codex oder Claude Code: was ist 2026 besser für mein Team?

Beide sind ernsthafte Optionen mit unterschiedlichen Stärken. Codex hat höhere Werte auf Terminal Bench 2.0, ein breiteres Plugin Ökosystem, Computer Use und das /goal Feature. Claude Code hat höhere Werte auf SWE Bench Verified, ein größeres Context Window von 1 Million Tokens und stabilere Kosten über Claude Max. Für OpenAI nahe Stacks ist Codex stärker, für komplexe Backend Refactorings empfehlen wir Claude Code.

Ist Codex CLI Open Source?

Ja, Codex CLI ist Apache 2.0 lizenziert und auf GitHub verfügbar. Die Codex App und Codex Cloud sind dagegen proprietär, lassen sich aber mit der gleichen Skill und Plugin Konfiguration betreiben. Skills werden über Markdown Dateien in ~/.agents/skills/ verteilt.

Kann ich Codex Skills und Plugins selbst entwickeln?

Ja. Skills sind SKILL.md Dateien mit Anweisungen, die Codex automatisch lädt, sobald der Task passt. Plugins bündeln Skills, MCP Server und App Integrationen in einer Distributions Einheit. OpenAI hat den Plugin Bereich im April 2026 mit über 90 neuen Integrationen ausgebaut, darunter Atlassian Rovo, GitLab Issues und CodeRabbit.

Was ist Codex Computer Use und wo läuft es?

Computer Use erlaubt Codex im Hintergrund mit eigenem Cursor andere Apps zu bedienen. Mehrere Agents können parallel auf einem Mac arbeiten ohne den menschlichen Workflow zu blockieren. Aktuell ist Computer Use auf macOS verfügbar, EU und UK Rollout läuft schrittweise. Auf Windows ist Computer Use noch nicht freigeschaltet.

Wie unterscheidet sich Codex CLI von der alten Codex API?

Die alte Codex API von 2021 bis 2023 war ein reines Code Completion Modell und wurde abgekündigt. Die heutige Codex Plattform ist ein komplett neues Produkt, das im April 2025 startete. Wer den Namen mit der alten API verbindet, übersieht die Plattform vollständig. Codex CLI ist heute ein agentisches Coding Tool im selben Segment wie Claude Code.

Ersetzt Codex menschliche Code Reviews?

Nein. /goal und Automations erhöhen den Bedarf an Reviews, weil mehr Code autonom produziert wird. Wir empfehlen automatische Code Reviews mit CodeRabbit, klare Spec Driven Development Patterns und manuelle Reviews vor dem Merge. Das ist auch die offizielle Position von OpenAI: Höhere Agent Autonomie macht menschliche Aufsicht wichtiger, nicht überflüssig.

Setzt NCA Codex in eigenen Projekten ein?

Nein. Unser Production Stack basiert auf Claude Code und OpenCode mit lokalen Modellen über Ollama. Wir kennen Codex aus Vergleichstests und Beratungsprojekten und ordnen die Plattform editorial ein. Wenn ein Team im OpenAI Ökosystem zuhause ist, beraten wir zur sinnvollen Codex Nutzung. Wenn ein Team auf Anthropic oder Open Source setzt, empfehlen wir entsprechende Alternativen.

Funktionieren Codex Skills mit anderen Coding Agents?

Skills sind aktuell ein OpenAI eigenes Format. Konzeptionell ähneln sie Vercels Agent Skills Ökosystem und Claude Code Plugins. Eine direkte Übertragbarkeit zwischen den Plattformen gibt es nicht, weil jede Plattform eigene Konventionen und Tool Schemas verwendet. Wer plattformübergreifend dokumentiert, sollte mit Markdown SKILL Dateien beginnen, um Reibungsverluste zu minimieren.

Brauche ich Codex App, CLI oder beides?

Das hängt vom Use Case ab. CLI ist für reine Terminal Workflows und CI Integrationen ideal, App für Frontend, Browser Tests und plattformübergreifende Automation. Viele Teams nutzen beide parallel: CLI für Backend Coding, App für UI Iteration und Plugin gestützte Workflows. Skills und Konfiguration werden zwischen beiden geteilt.