Was sind KI-Agenten?

Du hast in den bisherigen Kursen gelernt, wie du KI-Tools nutzt, Prompts schreibst und generative KI verstehst. Jetzt betreten wir das nächste Level: KI-Agenten. Systeme, die nicht nur antworten, sondern eigenständig handeln, planen und Aufgaben erledigen. Willkommen beim Paradigmenwechsel von 2025/2026.

Aber was genau unterscheidet einen KI-Agenten von einem normalen Chatbot? Und warum sprechen alle plötzlich von «Agentic AI»? In dieser Lektion bekommst du die Grundlagen, die du brauchst, um das gesamte Thema zu durchdringen.

Wusstest du? Der Begriff «Agent» stammt aus der Informatik und bedeutet «handelnde Einheit». In der KI-Forschung wird er seit den 1990er-Jahren verwendet. Doch erst 2025 wurde das Konzept durch bessere Sprachmodelle, Tool-Use-Fähigkeiten und längere Kontextfenster praxistauglich. 2026 sind KI-Agenten das dominierende Thema der Tech-Branche. Gartner hat «Agentic AI» zum Top-Trend erklärt.

Chatbot vs. KI-Agent

Um KI-Agenten zu verstehen, hilft ein klarer Vergleich. Ein klassischer Chatbot – egal ob regelbasiert oder LLM-gestützt, funktioniert nach dem Prinzip Prompt rein, Antwort raus. Du stellst eine Frage, das Modell antwortet. Fertig. Jede Interaktion steht für sich.

Ein KI-Agent geht fundamental weiter: Er bekommt ein Ziel, zerlegt es in Teilschritte, nutzt Tools (APIs, Datenbanken, Websuche, Code-Ausführung), überprüft seine Ergebnisse und korrigiert sich selbst. Er handelt autonom, innerhalb definierter Grenzen.

Klassischer Chatbot:

Du fragst: «Wie wird das Wetter morgen in Zürich?» Der Chatbot antwortet basierend auf seinem Trainingswissen (das veraltet sein kann) oder sagt: «Ich habe keinen Zugriff auf aktuelle Wetterdaten.»

KI-Agent:

Du sagst: «Plane meinen Outdoor-Tag morgen in Zürich.» Der Agent ruft die Wetter-API ab, prüft deine Kalenderverfügbarkeit, sucht passende Outdoor-Aktivitäten, berücksichtigt die Wettervorhersage und erstellt einen konkreten Tagesplan mit Zeitfenstern und Alternativvorschlägen bei Regen.

Die drei Kernmerkmale

Jeder echte KI-Agent besitzt drei fundamentale Eigenschaften, die ihn von einem einfachen LLM-Chat unterscheiden:

1. Autonomie: Der Agent trifft eigenständig Entscheidungen über seine nächsten Schritte. Du gibst das Ziel vor, nicht den Weg dorthin. Er wählt selbst, welche Tools er nutzt, in welcher Reihenfolge er vorgeht und wann er fertig ist.

2. Zielorientierung: Statt auf einzelne Prompts zu reagieren, verfolgt der Agent ein übergeordnetes Ziel. Er behält den Kontext über mehrere Schritte hinweg bei und arbeitet systematisch auf das Ergebnis hin.

3. Tool-Nutzung: Der Agent kann externe Werkzeuge einsetzen: APIs aufrufen, im Internet suchen, Code ausführen, Dateien lesen und schreiben, Datenbanken abfragen. Das erweitert seine Fähigkeiten weit über reines Textwissen hinaus.

Praxis-Tipp: Wenn du bewerten willst, ob ein System ein echter KI-Agent ist, stelle diese drei Fragen: Kann es eigenständig mehrere Schritte planen? Kann es externe Tools nutzen? Kann es seine eigenen Ergebnisse überprüfen und korrigieren? Wenn alle drei mit Ja beantwortet werden, hast du es mit einem Agenten zu tun.

Der Perception-Reasoning-Action-Loop

KI-Agenten arbeiten in einem kontinuierlichen Kreislauf, der sich Perception-Reasoning-Action-Loop (Wahrnehmung-Überlegung-Handlung) nennt:

Perception (Wahrnehmung): Der Agent nimmt Informationen auf: deinen Auftrag, die Ergebnisse seiner vorherigen Aktionen, Fehlermeldungen, neue Daten aus APIs. Er «sieht», wo er steht.

Reasoning (Überlegung): Basierend auf dem Wahrgenommenen überlegt der Agent: Was ist mein Ziel? Was habe ich bisher erreicht? Was ist der beste nächste Schritt? Hier kommt die Stärke des LLMs zum Tragen: logisches Denken, Planung, Priorisierung.

Action (Handlung): Der Agent führt eine konkrete Aktion aus: einen API-Call, eine Code-Ausführung, eine Datenbankabfrage, eine Websuche. Das Ergebnis fliesst wieder in die Wahrnehmung ein, und der Loop beginnt von vorn.

Dieser Kreislauf wiederholt sich, bis das Ziel erreicht ist oder der Agent erkennt, dass er nicht weiterkommt und menschliche Hilfe braucht.

Typen von KI-Agenten

Nicht alle Agenten sind gleich. In der Forschung und Praxis unterscheidet man drei Haupttypen:

Reactive Agents (Reaktive Agenten)

Reagieren direkt auf Eingaben ohne langfristige Planung. Sie folgen vordefinierten Regeln: Wenn X, dann tue Y. Schnell und vorhersagbar, aber wenig flexibel.

Beispiel: Ein Kundenservice-Bot, der eingehende E-Mails nach Schlüsselwörtern kategorisiert und vorgefertigte Antworten sendet.

Stärken: Schnell, vorhersagbar, einfach zu debuggen.

Schwächen: Kann nicht mit unerwarteten Situationen umgehen.

Deliberative Agents (Überlegende Agenten)

Planen voraus, erstellen Strategien und passen ihre Pläne basierend auf neuen Informationen an. Sie nutzen Chain-of-Thought-Reasoning, um komplexe Aufgaben zu zerlegen.

Beispiel: Ein Research-Agent, der eine Marktanalyse erstellt: er plant seine Recherchestrategie, sammelt Daten aus verschiedenen Quellen, analysiert sie und erstellt einen strukturierten Bericht.

Stärken: Kann komplexe, mehrstufige Aufgaben lösen.

Schwächen: Langsamer, höherer Ressourcenverbrauch, schwieriger zu kontrollieren.

Hybrid Agents (Hybride Agenten)

Kombinieren reaktive und deliberative Elemente. Für Routineaufgaben reagieren sie schnell nach Regeln, bei komplexen Situationen schalten sie in den Planungsmodus.

Beispiel: Claude Code, für einfache Code-Änderungen handelt es schnell und direkt, für grössere Refactorings plant es eine mehrstufige Strategie mit Tests und Validierung.

Stärken: Flexibel, effizient, praxistauglich.

Schwächen: Komplexer zu entwickeln und zu testen.

Beispiele aus der Praxis (2025/2026)

KI-Agenten sind keine Zukunftsmusik, sie sind heute im Einsatz:

Devin (Cognition): Ein KI-Softwareentwickler, der eigenständig Code schreibt, debuggt, Tests erstellt und Pull Requests anlegt. Er arbeitet in einer eigenen Entwicklungsumgebung und kann stundenlang autonom an Features arbeiten.
Claude Code (Anthropic): Ein Coding-Agent, der direkt im Terminal läuft, Dateien liest und schreibt, Git-Befehle ausführt und komplexe Software-Projekte umsetzen kann.
AutoGPT / BabyAGI: Frühe Open-Source-Agenten (2023), die zeigten, was möglich ist, auch wenn sie noch unzuverlässig waren. Sie legten den Grundstein für die heutige Agent-Bewegung.
OpenAI Operator: Ein Agent, der Webbrowser steuern und Online-Aufgaben erledigen kann, von Bestellungen bis Recherchen.

Beispiel: Stell dir vor, du bittest einen KI-Agenten: «Analysiere unsere letzten 100 Kundenbewertungen und erstelle einen Verbesserungsplan.» Der Agent würde: (1) Die Bewertungen aus deiner Datenbank laden, (2) Sentiment-Analyse durchführen, (3) Wiederkehrende Themen identifizieren, (4) Die Themen nach Häufigkeit und Schwere priorisieren, (5) Konkrete Verbesserungsmassnahmen vorschlagen, (6) Das Ganze als strukturierten Bericht formatieren. Ein Chatbot hätte gesagt: «Bitte kopiere die Bewertungen hier rein.»

Warum jetzt der Durchbruch?

Das Konzept von KI-Agenten existiert seit Jahrzehnten. Warum funktionieren sie erst jetzt? Drei Faktoren kamen 2025/2026 zusammen:

Bessere Basismodelle: GPT-5, Claude 4.5/4.6, Gemini 3: die aktuellen LLMs sind intelligent genug, um mehrstufige Reasoning-Aufgaben zuverlässig zu bewältigen. Frühere Modelle machten zu viele Fehler in der Planung.

Tool Use als Standard: Alle grossen Anbieter (OpenAI, Anthropic, Google) haben native Tool-Use-Schnittstellen in ihre Modelle integriert. Agenten können jetzt zuverlässig externe APIs, Datenbanken und Code-Ausführungsumgebungen nutzen. Zusätzlich hat sich das Model Context Protocol (MCP) als offener Standard für die Anbindung von KI-Agenten an externe Tools und Datenquellen etabliert, vergleichbar mit einem «USB-C für KI-Anwendungen».

Längere Kontextfenster: Von 4'000 Tokens (2023) auf 200'000+ Tokens (2026). Agenten können mehr Kontext behalten, grössere Dateien verarbeiten und längere Aufgabenketten im «Gedächtnis» halten.

Achtung: KI-Agenten sind mächtig, aber nicht unfehlbar. Sie können in Loops geraten, falsche Entscheidungen treffen oder Tools falsch einsetzen. Gib einem Agenten niemals unkontrolliert Zugriff auf kritische Systeme (Produktionsdatenbanken, Finanzsysteme, E-Mail-Versand an Kunden). Setze immer Grenzen und implementiere Sicherheitsmechanismen, dazu mehr in späteren Lektionen.

Was unterscheidet einen KI-Agenten grundlegend von einem klassischen Chatbot?

Richtig! Die drei Kernmerkmale eines KI-Agenten sind Autonomie (eigenständig handeln), Zielorientierung (mehrstufige Planung) und Tool-Nutzung (APIs, Code, Datenbanken). Das unterscheidet ihn fundamental vom Prompt-Antwort-Muster eines Chatbots.

Nicht ganz. Die Modellgrösse oder die Zielgruppe sind nicht die entscheidenden Unterschiede. KI-Agenten zeichnen sich durch drei Kernmerkmale aus: Autonomie (eigenständig handeln), Zielorientierung (mehrstufige Planung) und Tool-Nutzung (APIs, Code, Datenbanken). Ein Chatbot reagiert nur auf einzelne Prompts, ein Agent verfolgt ein Ziel über mehrere Schritte.

Key Takeaways:

KI-Agenten handeln autonom, verfolgen Ziele und nutzen externe Tools, im Gegensatz zu Chatbots, die nur auf einzelne Prompts reagieren.
Der Perception-Reasoning-Action-Loop ist der Kernmechanismus: Wahrnehmen, Überlegen, Handeln, in einer Schleife bis zum Ziel.
Es gibt drei Agenten-Typen: Reactive (regelbasiert), Deliberative (planend) und Hybrid (kombiniert).
Der Durchbruch 2025/2026 wurde durch bessere Modelle, native Tool-Use-Schnittstellen und grössere Kontextfenster ermöglicht.
KI-Agenten sind mächtig, aber brauchen Sicherheitsgrenzen: unkontrollierte Autonomie ist riskant.

Weiter →