Welches KI-Modell für welche Aufgabe? Routing-Guide für Gründer

Ein zentraler Router verteilt verschiedene Aufgabentypen an passende Modelle und führt die Ergebnisse zusammen. — Aufgaben nach Typ und Risiko auf das passende Modell verteilen statt auf ein einziges Standardmodell.

Das Problem mit zufälligem Modellwechsel

Warum mehr Modelle nicht automatisch bessere Ergebnisse bedeuten

Wer mit mehreren KI-Tools arbeitet, kennt die Situation: Für die eine Aufgabe ChatGPT, für die nächste Claude, dann doch wieder ein anderes — nach Gefühl, nicht nach Regel. Das fühlt sich flexibel an, erzeugt aber keine konsistenteren Ergebnisse. Mehr Modelle zur Auswahl zu haben, hilft nur, wenn klar ist, wann welches sinnvoll ist.

Das eigentliche Problem ist nicht die Modellauswahl an sich. Es ist das Fehlen einer Regel: Welcher Aufgabentyp braucht welche Art von Modell und welchen Modus? Ohne diese Regel entsteht entweder das eine Extrem — immer das teuerste Modell für alles — oder das andere: zufälliges Wechseln ohne nachvollziehbaren Grund.

Die versteckten Kosten: Reasoning-Modi ohne Struktur

Moderne Modelle bieten unterschiedliche Reasoning-Modi an — Stufen, in denen das Modell vor der Antwort mehr oder weniger „nachdenkt". Höhere Modi kosten mehr Zeit und Ressourcen. Wer sie unbewusst als Standard verwendet, zahlt für jede triviale Aufgabe einen Aufschlag, der nicht nötig wäre.

Diese Kosten sind versteckt, weil sie sich nicht in einer einzelnen Aufgabe bemerkbar machen, sondern über viele Aufgaben hinweg summieren. Eine bewusste Modus-Wahl ist deshalb kein Detail, sondern ein Steuerungssystem.

Typische Fehler beim Routing

Das teuerste Modell für jede Aufgabe verwenden.
Mit der Implementierung beginnen, ohne vorher einen Plan zu fassen.
Dasselbe Modell schreibt und prüft alles in derselben Sitzung.
Keine Stop Rules definieren — das Modell rät weiter, statt zu pausieren.
Mehrere Agenten bearbeiten parallel dieselben Dateien.
Kein eigener Verifikationsschritt nach der Umsetzung.
Routing nur nach Marke statt nach Aufgabentyp.

Aufgabentypen als Entscheidungsgrundlage

Statt nach Modell zu sortieren („Claude kann X, ChatGPT kann Y"), beginnt ein belastbares Routing beim Aufgabentyp. Vier Typen decken den Großteil eines Gründer-Workflows ab — jeder stellt andere Anforderungen.

Strategie und Richtungsentscheidungen

Strategie braucht Breite, Kontext und kritische Rückfragen. Hier geht es um Richtung und Prioritäten, nicht um die schnelle Ausführung. Mehrdeutige Fragen rechtfertigen einen höheren Reasoning-Modus — und am Ende steht eine menschliche Entscheidung, keine automatische.

Implementierung und Umsetzungsarbeit

Umsetzung braucht Tiefe und einen eng abgegrenzten Scope. Eine klar formulierte, eingegrenzte Aufgabe lässt sich oft im Normal-Modus zuverlässig lösen. Steigt das Risiko — etwa bei sensiblen oder schwer umkehrbaren Änderungen — ist eine Eskalation gerechtfertigt.

QA und Verifikation

Prüfung braucht Fokus und Unabhängigkeit. Wer schreibt, sollte nicht allein über das Ergebnis urteilen. Ein separater Durchgang — idealerweise mit einer anderen Instanz oder einem anderen Modell — findet Fehler, die der ursprüngliche Schritt übersieht.

Recherche und Synthese

Recherche braucht Breite und Geschwindigkeit. Häufig reicht ein schneller Modus, um Optionen zu sammeln und einzuordnen. Wichtig ist hier weniger der teuerste Modus als das anschließende Gegenprüfen der Quellen.

In der Praxis lohnt sich eine feinere Auflösung. Die folgende Matrix ordnet typische Aufgabenklassen einem Reasoning-Modus und einem Review-Schritt zu — als Ausgangspunkt, nicht als feste Rangliste:

Aufgabentyp	Worauf es ankommt	Reasoning-Modus	Review
Recherche & Orientierung	Breite und Geschwindigkeit	meist Normal	Quellen gegenprüfen
Strategie & Planung	Breite, Kontext, kritische Rückfragen	High bei Mehrdeutigkeit	menschliche Freigabe
UX- & Content-Konzeption	Klarheit und Zielgruppenbezug	Normal bis High	gegen die Zielgruppe prüfen
Code-Implementierung	Tiefe und eng abgegrenzter Scope	Normal, High bei Risiko	separater Review
Code-Review & Verifikation	Fokus und Unabhängigkeit	eigenes Modell oder eigene Instanz	Tests + unabhängige Prüfung
Große Repository-Aufgaben	isolierte, parallele Arbeit	High + klare Stop Rules	Worktree, Konfliktvermeidung
Kleine operative Korrekturen	Geschwindigkeit, geringes Risiko	Normal	leichte Prüfung genügt

Welches Werkzeug für welche Aufgabe (Stand Juni 2026)

Die Methode oben ist bewusst werkzeugunabhängig — sie bleibt gültig, auch wenn sich Modelle ändern. Trotzdem ist die praktische Frage berechtigt: Welches Tool eignet sich heute für welche Aufgabe? Die folgende Einordnung ist eine Momentaufnahme, keine Rangliste und kein „Gesamtsieger". Werkzeuge werden für unterschiedliche Aufgaben unterschiedlich stark — und sie entwickeln sich schnell.

Aufgabe	Naheliegende Werkzeuge	Worauf achten / Gegenprobe
Recherche & Quellen	Perplexity, ChatGPT	Quellengestützt arbeiten; Aussagen gegenprüfen statt blind übernehmen.
Strategie & Sparring	ChatGPT, Claude	Bei Mehrdeutigkeit höheren Reasoning-Modus; Entscheidung bleibt menschlich.
Produktkonzept	Claude, ChatGPT	Annahmen offenlegen lassen; gegen die Zielgruppe prüfen.
UX & Design-Struktur	ChatGPT, Gemini	Gemini bei Bild-/Multimodal-Bezug; Ergebnis an echten Nutzern spiegeln.
Texterstellung	ChatGPT, Claude	Marken-Ton vorgeben; auf generische Floskeln und Wiederholungen achten.
Coding (Umsetzung)	Claude / Claude Code, Codex	Eng abgegrenzter Scope; bei Risiko eskalieren statt raten lassen.
Code Review	anderes Modell als die Umsetzung	Nicht dasselbe Modell schreiben und prüfen lassen — Unabhängigkeit findet mehr.
Debugging	Claude, ChatGPT/Codex	Reproduktion zuerst; das Modell die Hypothese begründen lassen.
SEO-Inhalte	ChatGPT, Claude + Perplexity	Fakten/Quellen über Perplexity gegenprüfen; keine erfundenen Vergleiche.
Dokumente & lange Texte	Claude, Gemini	Große Kontexte bewusst strukturieren; Quellenbezug und Abschnittsprüfung verlangen.
Lange Projektkontexte	Claude, Gemini	Kontext als Datei führen statt im Chat — siehe Projektkontext-Guide.
Agenten-/Repo-Arbeit	Codex, Claude Code	Isolierte Umgebung/Worktree, klare Stop-Regeln, unabhängige Verifikation.

Beispielhafte Zuordnung zur Orientierung — frei anpassbar. Welches Werkzeug eine Rolle übernimmt, entscheidest du nach deinem Workflow, nicht nach einer festen Rangfolge.

Kurzprofile: Stärken, Schwächen, typische Fehler

Jedes Werkzeug hat einen Bereich, in dem es heute besonders überzeugt — und einen, in dem ein anderes sinnvoller ist. Die Kurzprofile zeigen, wofür sich die gängigen Werkzeuge derzeit eignen und welcher Fehler in der Praxis am häufigsten auftritt.

ChatGPT (OpenAI)

Aktuell: GPT-5.5-Familie (Instant als Standard, Thinking, Pro); GPT-5.4 mit großem Kontext.

Stärken: Breite Allround-Stärke, schnelles Sparring, integrierte Werkzeuge, gute Textarbeit.
Schwächen: Bei sehr langen, regelgebundenen Repo-Aufgaben braucht es klare Struktur, sonst driftet der Fokus.
Typischer Fehler: Den Standard-Modus für riskante, mehrstufige Aufgaben verwenden, ohne bewusst zu eskalieren.

Claude (Anthropic)

Aktuell: Opus 4.8 (komplexes Reasoning, agentisches Coding), Sonnet 4.6 (Balance, 1 Mio Token), Haiku 4.5 (schnell), Fable 5.

Stärken: Lange, disziplinierte Umsetzung in großen Kontexten; starkes Coding; folgt Projektregeln eng.
Schwächen: Höhere Modi kosten mehr — für triviale Aufgaben selten gerechtfertigt.
Typischer Fehler: Claude alles schreiben und sich selbst prüfen lassen, statt Review zu trennen.

Gemini (Google)

Aktuell: Gemini-3-Familie mit Gemini 3.5 Flash (stabil) und Gemini 3.1 Pro (Preview), plus multimodale und agentische Varianten.

Stärken: Starke multimodale Verarbeitung (Bild, PDF, Video), Recherche im Google-Umfeld, agentische Ansätze.
Schwächen: Verhalten je Variante unterschiedlich; Vorschau-Modelle ändern sich schnell.
Typischer Fehler: Multimodale Ausgaben ungeprüft übernehmen, statt sie gegen die Quelle zu spiegeln.

Perplexity

Aktuell: Such- und quellengestützte Recherche mit verlinkten Originalseiten; Produktdetails ändern sich laufend.

Stärken: Schnelle, quellenorientierte Discovery mit Links zu den gefundenen Originalseiten.
Schwächen: Kein dediziertes Coding-/Repo-Werkzeug; eher Recherche als Umsetzung.
Typischer Fehler: Zusammenfassungen ohne Blick auf die verlinkten Primärquellen zitieren.

Codex & Claude Code

Aktuell: Agentische Coding-Werkzeuge: Arbeit in isolierten Umgebungen/Worktrees, parallele Aufgaben, Tests im Lauf.

Stärken: Repository-nahe Ausführung, parallele Tasks, reproduzierbare Schritte.
Schwächen: Ohne Stop-Regeln und Scope-Grenzen kann autonome Ausführung über das Ziel hinausschießen.
Typischer Fehler: Mehrere Agenten parallel dieselben Dateien anfassen lassen — ohne Isolation entstehen Konflikte.

Wann ein zweites Modell zur Kontrolle sinnvoll ist

Ein zweites Werkzeug ist keine doppelte Arbeit, sondern eine Gegenprobe — besonders dort, wo Fehler teuer oder schwer erkennbar sind. Sinnvoll ist eine unabhängige Kontrolle vor allem:

bei Code Review und Verifikation — ein anderes Modell als das, das den Code geschrieben hat;
bei faktischen Aussagen — z. B. eine quellengestützte Recherche gegen die ursprüngliche Antwort prüfen;
bei strategischen Entscheidungen mit hoher Tragweite, wo ein zweiter Blick blinde Flecken aufdeckt;
wenn ein Ergebnis zu glatt wirkt — Übereinstimmung zweier unabhängiger Werkzeuge erhöht das Vertrauen, Abweichung zeigt, wo genauer zu prüfen ist.

Nicht jede Aufgabe braucht eine zweite Instanz. Für kleine, leicht verifizierbare Schritte genügt eine leichte Prüfung. Die Gegenprobe ist ein gezieltes Werkzeug für Risiko, nicht der Standard für alles.

Der Entscheidungspfad: in fünf Fragen zum passenden Modell

Die Einordnung oben lässt sich zu einem festen Pfad verdichten. Fünf Fragen, immer in derselben Reihenfolge — am Ende stehen Primärwerkzeug, Reasoning-Modus und Review-Modell. Der Pfad ist ein Arbeitsmittel, kein Ranking: Welches konkrete Tool eine Rolle übernimmt, bleibt deine Entscheidung.

Was für eine Aufgabe ist es?
- Fakten, Markt, Quellen quellengestützte Recherche (z. B. Perplexity, Deep-Research-Funktionen) — weiter mit Schritt 2
- Text, Konzept, Strategie Allround-Chat-Modell (z. B. ChatGPT, Claude) — weiter mit Schritt 2
- Code im Repository Coding-Agent (z. B. Claude Code, Codex) — weiter mit Schritt 2
Wie groß ist der nötige Kontext?
- Passt bequem in einen Chat freie Werkzeugwahl — der Kontext schränkt nichts ein
- Lange Dokumente oder ganzes Repo Werkzeug mit großem Kontextfenster wählen und den Kontext zusätzlich als Datei führen (siehe Projektkontext-Guide)
Coding oder Research?
- Coding isolierte Umgebung oder Worktree, eng abgegrenzter Scope, Stop-Regeln — Details im Vergleich Claude Code vs. Codex
- Research Deep-Research-Funktion nutzen und entscheidungsrelevante Aussagen an Primärquellen prüfen — Details im Research-Guide
- Beides (z. B. technisches Konzept) in zwei Aufgaben trennen: erst Research mit Quellen, dann Umsetzung mit eigenem Review
Geschwindigkeit oder Tiefe?
- Klar abgegrenzt, geringes Risiko Normal-Modus — der kleinste Modus, der die Aufgabe sicher löst
- Riskant, mehrdeutig, mehrstufig bewusst auf einen höheren Reasoning-Modus eskalieren und die Begründung festhalten
Wer prüft das Ergebnis?
- Trivial und leicht verifizierbar leichte eigene Prüfung genügt
- Code, Fakten oder hohe Tragweite anderes Modell oder andere Instanz als Reviewer — nie dasselbe Modell schreiben und abnehmen lassen

Für die häufigsten Situationen ergibt der Pfad typische Kombinationen. Die Tabelle ist eine beispielhafte Zuordnung zum Starten — sobald sich eine Kombination bewährt, gehört sie in deine Routing-Datei, damit die Entscheidung nicht in jeder Session neu fällt:

Situation	Primärwerkzeug	Reasoning-Modus	Review-Modell
Marktrecherche vor einer Scope-Entscheidung	Deep Research (quellengestützt)	Normal	Primärquellen selbst prüfen
Landing-Page-Texte schreiben	ChatGPT oder Claude	Normal	leichte Prüfung + Zielgruppen-Check
Neues Feature im Repo umsetzen	Claude Code oder Codex	Normal, High bei Risiko	anderes Modell reviewt den Diff
Architektur-/Strategieentscheidung	Reasoning-Modell (Chat)	High	zweites Modell als Gegenprobe, Mensch entscheidet
Langes Dokument auswerten	Claude oder Gemini (großer Kontext)	Normal	Stichproben gegen das Original
Bugfix mit unklarer Ursache	Coding-Agent mit Reproduktion zuerst	High	Tests + unabhängige Verifikation

Tool-Nennungen sind Beispiele, konsistent mit der datierten Einordnung oben — keine Rangliste. Für Repository-Arbeit hilft der Vergleich Claude Code vs. Codex, für quellenkritische Recherche der Guide KI-Recherche für Gründer.

Was Reasoning-Modi bedeuten

Normal, High, Extra, Max — wann macht eine Eskalation Sinn?

Reasoning-Modi sind eine eigene Dimension neben der Modellwahl. Sie steuern, wie viel Aufwand ein Modell in die Lösung steckt, bevor es antwortet. Ein einfacher Merksatz: Der Normal-Modus löst die meisten Alltagsaufgaben. Eine Eskalation auf einen höheren Modus ist dann sinnvoll, wenn das Problem riskant, komplex oder mehrdeutig ist — also wenn ein Fehler teuer wäre oder die Aufgabe mehrere Schritte sauber verbinden muss.

Die genauen Bezeichnungen und Stufen unterscheiden sich je Anbieter und ändern sich über die Zeit. Die Kategorisierung hier ist ein konfigurierbares Entscheidungsmodell, keine Aussage über das aktuelle Angebot eines bestimmten Anbieters.

Warum Extended Thinking nicht für jede Aufgabe gerechtfertigt ist

Ein höherer Modus ist verlockend, weil er „gründlicher" klingt. Aber gründlicher ist nicht immer besser: Für eine klar abgegrenzte, einfach verifizierbare Aufgabe bringt zusätzliches „Nachdenken" kaum mehr Qualität — es kostet nur mehr. Die Faustregel bleibt: Der Aufwand eines höheren Modus muss durch das Risiko oder die Komplexität der Aufgabe gerechtfertigt sein.

Plan, Implementation, Review, Verification

Neben dem Reasoning-Modus gibt es eine zweite, oft übersehene Ebene: den Arbeitsmodus. Eine größere Aufgabe durchläuft in der Regel vier Phasen — und jede Phase hat ein anderes Ziel und damit ein anderes passendes Routing.

Plan Mode: die Aufgabe verstehen, Optionen abwägen, einen Weg festlegen — ohne schon zu schreiben. Hier zahlt sich ein starkes Reasoning-Modell aus.
Implementation Mode: den festgelegten Plan eng am Scope umsetzen. Geeignet ist ein Modell, das diszipliniert innerhalb klarer Regeln arbeitet.
Review Mode: das Ergebnis kritisch prüfen — bewusst getrennt von dem, der es erstellt hat.
Verification Mode: objektiv nachweisen, dass es funktioniert — über Tests und eine unabhängige Prüfung statt über ein Bauchgefühl.

Ein konkretes Beispiel zeigt, wie diese Modi zusammenspielen — etwa für die Aufgabe, eine neue SEO-Landingpage zu implementieren:

Routing-Beispiel — Aufgabe: neue SEO-Landingpage

Plan: starkes Reasoning-Modell — Struktur, Risiken, Scope klären

Implementation: Coding-Agent — Umsetzung eng nach den Projektregeln

Review: separater Reviewer — unabhängig vom Implementierungsschritt

Verification: Tests + Browser-QA — objektiver Nachweis statt Bauchgefühl

Die Ressourcen-Policy: den kleinsten Modus wählen

Das Prinzip

Die Ressourcen-Policy lässt sich in einem Satz zusammenfassen: Nimm den kleinsten Modus, der die Aufgabe sicher löst. Nicht das teuerste Modell als Standard, sondern bewusstes Eskalieren nach Bedarf. Das macht den Ressourceneinsatz messbar und nachvollziehbar — und verhindert, dass einfache Aufgaben teuer werden.

Ein konkretes Beispiel (aus dem Beispielprojekt)

Wie eine solche Entscheidung in der Praxis aussieht, zeigt das fiktive Beispielprojekt FeedbackPing. Für eine kleine, klar abgegrenzte Aufgabe wird bewusst der Normal-Modus gewählt — und die Begründung festgehalten:

MODEL_ROUTING_DECISION.md — Beispiel: FeedbackPing

Aufgabe: TASK-001 — ein optionales Kommentarfeld ergänzen

Aufgabentyp: Implementierung

Routing: Claude in der Implementer-Rolle

Reasoning-Modus: Normal — geringes Risiko, klar abgegrenzt, einfach verifizierbar

Warum nicht mehr: Der Aufwand eines höheren Modus ist für diese Aufgabe nicht gerechtfertigt.

Routing-Entscheidungen dokumentieren statt improvisieren

Warum die gleiche Frage immer wieder auftaucht

Ohne festen Ort wird die Routing-Frage in jedem Projekt — und manchmal in jeder Session — neu gestellt: Welches Tool, welcher Modus, wer prüft? Diese wiederholte Überlegung kostet Zeit und führt zu Inkonsistenzen, weil die Antwort jedes Mal leicht anders ausfällt.

Eine MODEL_ROUTING-Datei: Entscheidungen einmal festhalten

Die Lösung ist dieselbe wie beim Projektkontext: eine Datei, die außerhalb einzelner Chats lebt. Eine Routing-Tabelle hält fest, welcher Aufgabentyp welchem Werkzeug und Modus zugeordnet ist — einmal entschieden, immer wieder anwendbar. So sieht eine beispielhafte, frei anpassbare Zuordnung aus:

MODEL_ROUTING.md Auszug

Strategie / Sparring ChatGPT Richtung, Prioritäten, kritische Rückfragen
Langform-Umsetzung / komplexes Reasoning Claude Eingegrenzte Umsetzung nach den Regeln des Projekts
Repository-Ausführung / Tests / Verifikation Codex Gates, Checks und unabhängige Prüfung

Fiktives Beispielprojekt — keine echten Personen oder Firmen.

Beispielhafte Zuordnung — keine Rangliste.
Das Routing ist frei anpassbar.
Keine automatische Provider-Steuerung.

Wichtig: Das ist eine beispielhafte Zuordnung, keine Rangliste und keine automatische Steuerung. Welches Tool welche Rolle übernimmt, entscheidest du — die Datei hält die Entscheidung nur nachvollziehbar fest.

Das AI Orchestrator Kit: Modell-Routing als Datei

Was das Kit enthält

Das AI Orchestrator Kit macht aus dieser Methode konkrete Vorlagen. Es enthält unter anderem:

AI_ROLE_MATRIX.md — welche KI welche Rolle übernimmt, mit klarer Aufgabentrennung.
MODEL_ROUTING.md — wie Tool und Modell für eine Aufgabe gewählt werden.
MODE_SELECTION.md — der kleinste Reasoning-Modus, der die Aufgabe sicher löst.
TASK_ROUTING.md — wie eine rohe Aufgabe geformt, eingegrenzt und weitergeleitet wird.
RESOURCE_POLICY.md — bewusster Einsatz teurer Modi.
QUALITY_GATES.md und HANDOFF_LOG.md — die Messlatte für „fertig" und ein nachvollziehbarer Verlauf abgeschlossener Arbeit.

Das Kit besteht aus Markdown-Dateien in einem ZIP — lokal im Projektordner, kein Account, keine Cloud, kein Abo. Die Produktdateien selbst sind auf Englisch, damit sie mit allen gängigen Modellen zuverlässig funktionieren. Entscheidend: Das Kit steuert keine Modelle automatisch. Es enthält ein Entscheidungsmodell als Datei, das du für jede Aufgabe anwendest.

Wie Routing mit dem Projektkontext zusammenhängt

Gutes Routing setzt guten Kontext voraus. Ohne einen klaren Projektkontext fehlt dem Modell die Grundlage, um eine Aufgabe richtig einzuordnen — und dann hilft auch das beste Routing wenig. Beide Ebenen greifen ineinander: Der Kontext sagt, worum es geht; das Routing sagt, wer es mit welchem Modus bearbeitet. Wie sich beide Ebenen zu einem durchgehenden Ablauf verbinden, zeigt der vollständige Workflow; die Produktsicht auf das Routing-Feature beschreibt die Seite Modell-Routing im System.

Quellen & Methodik

Die werkzeugbezogenen Angaben in dieser Seite (Modellnamen, Kontextfenster, Funktionen) wurden am 12. Juni 2026 an den offiziellen Produkt- und Dokumentationsseiten der jeweiligen Anbieter geprüft. Eignungs- und Workflow-Einschätzungen sind als Praxis-Orientierung gekennzeichnet. Es werden keine Vergleichszahlen oder Benchmarks behauptet, die nicht offiziell belegt sind.

OpenAI — Model Release Notes, Codex
Anthropic — Claude Models Overview
Google — Gemini API Models (zuletzt aktualisiert am 9. Juni 2026)
Perplexity — offizielle Research-Seite — automatisierter Abruf am Prüfdatum: HTTP 403; keine Detailaussage ausschließlich daraus abgeleitet.

Häufige Fragen

Muss ich für gute Ergebnisse immer das stärkste Modell verwenden?

Nein. Das stärkste oder teuerste Modell als Standard zu verwenden, ist meist Verschwendung. Viele Alltagsaufgaben — kleine Korrekturen, klar abgegrenzte Umsetzungen, einfache Recherche — werden vom Normal-Modus zuverlässig gelöst. Sinnvoll ist, den kleinsten Modus zu wählen, der die Aufgabe sicher löst, und nur bei riskanten oder mehrdeutigen Aufgaben bewusst zu eskalieren.

Was ist Model Routing?

Model Routing ist eine Methode, keine Automatik: Du klassifizierst eine Aufgabe nach Typ und Risiko, wählst dann einen passenden Arbeitsmodus, ein geeignetes Modell und einen Reasoning-Modus, und legst fest, wie das Ergebnis geprüft wird. Statt bei jeder Aufgabe neu zu raten, wendest du eine festgehaltene Regel an.

Sollte dasselbe Modell implementieren und prüfen?

Besser nicht. Wenn dasselbe Modell in derselben Sitzung schreibt und sich selbst prüft, übersieht es eher die eigenen Annahmen. Eine unabhängige Instanz oder ein anderes Modell für Review und Verifikation findet Fehler zuverlässiger. Diese Aufgabentrennung ist ein Kernprinzip des Routings.

Was ist ein Reasoning-Modus und warum kostet er mehr?

Ein Reasoning-Modus steuert, wie viel ein Modell vor der Antwort „nachdenkt". Höhere Modi (oft Normal, High, Extended oder Max genannt) verbrauchen mehr Rechenzeit und damit mehr Ressourcen. Sie sind für riskante, komplexe oder mehrdeutige Probleme gedacht — nicht als Standard für jede Aufgabe. Die genauen Namen und Stufen unterscheiden sich je Anbieter und ändern sich über die Zeit.

Funktioniert die Methode mit ChatGPT, Claude und Codex?

Ja. Die Methode ist anbieterunabhängig. ChatGPT, Claude und Codex sind nur Beispiele — die Logik bleibt dieselbe, egal welche Werkzeuge du einsetzt oder ob sich die Modelle ändern. Du ordnest Aufgabentypen Modi und Rollen zu; welches konkrete Tool diese Rolle übernimmt, ist frei konfigurierbar.

Was ist der Unterschied zwischen MODEL_ROUTING und TASK_ROUTING?

MODEL_ROUTING.md hält fest, wie Tool und Modell für eine Aufgabe gewählt werden. TASK_ROUTING.md beschreibt, wie eine rohe Aufgabe zuerst geformt, eingegrenzt und weitergeleitet wird, bevor ein Modell überhaupt arbeitet. Das eine wählt das Werkzeug, das andere bereitet die Aufgabe vor — beide gehören zum AI Orchestrator Kit.

Routet das AI Orchestrator Kit automatisch, oder muss ich das selbst machen?

Du machst es selbst. Das Kit steuert keine Modelle und keine APIs automatisch. Es enthält ein Entscheidungsmodell als Markdown-Dateien, das du für jede Aufgabe anwendest. Es ist eine strukturierte Grundlage für deine eigenen Routing-Entscheidungen, kein automatischer Dienst.