Wie ein KI-Agent wirklich funktioniert: Loop, Tools, Memory und Planning erklaert
Die meisten halten einen KI-Agenten fuer einen schlaueren Chatbot. Falsch. Die 4 Bausteine, die einen Agenten zum Agenten machen: Loop, Tools, Memory, Planning.
Die meisten Geschaeftsfuehrer denken bei "KI-Agent" an einen schlaueren ChatGPT. Das ist, als wuerde man ein Auto fuer ein schnelleres Pferd halten. Der Unterschied ist nicht Geschwindigkeit, sondern ein anderes Funktionsprinzip. Ein Chatbot antwortet, ein Agent handelt, und zwar in einer Schleife, bis ein Ziel erreicht ist. Wer diesen Unterschied einmal sauber verstanden hat, kann 2026 zum ersten Mal nuechtern beurteilen, was ein Agent wirklich kann und was Marketing-Versprechen ist. Hier sind die vier Bausteine, die einen Agenten zum Agenten machen: der Loop, die Tools, das Memory und das Planning. Allgemeinverstaendlich erklaert, technisch korrekt, mit Beispielen aus dem Mittelstand-Alltag.
Chatbot vs Agent: der eine Unterschied
Stell dir zwei Mitarbeiter vor. Der eine sitzt am Empfang und beantwortet Fragen: praezise, hilfsbereit, aber er steht nie auf. Du fragst, er antwortet, das war es. Der andere bekommt eine Aufgabe, geht los, oeffnet Schubladen, ruft jemanden an, kommt mit einem Zwischenergebnis zurueck, merkt dass etwas fehlt, geht nochmal los, und liefert am Ende ein fertiges Ergebnis. Der erste ist ein Chatbot. Der zweite ist ein Agent.
Technisch praezise: Ein klassischer Chatbot macht einen einzigen Durchlauf. Eingabe rein, eine Antwort raus, fertig. Er hat keinen Zugriff auf deine Systeme, er kann nichts ausfuehren, und er erinnert sich nach dem Tab-Schliessen an nichts. Ein Agent dagegen laeuft in einer Schleife, kann ueber Werkzeuge echte Aktionen ausloesen, behaelt Zwischenstaende und plant seine Schritte selbst. Genau diese vier Faehigkeiten, Schleife, Werkzeuge, Gedaechtnis und Planung, sind der Unterschied. Sie bauen aufeinander auf, und sie sind der Grund, warum ein Agent eine Aufgabe erledigen kann statt nur eine Frage zu beantworten.
Ein konkretes Gegenbeispiel macht es greifbar. Frag einen Chatbot "Stimmt diese Rechnung mit unserer Bestellung ueberein?", und er erklaert dir, worauf man bei einer Rechnungspruefung achtet. Hilfreich, aber er hat weder die Rechnung noch die Bestellung gesehen. Gib einem Agenten dieselbe Aufgabe, und er holt die Rechnung aus dem Posteingang, sucht die passende Bestellung im ERP, vergleicht Positionen und Betraege, findet eine Abweichung und meldet sie zurueck. Derselbe Satz, ein voellig anderes Verhalten. Wer die Begriffe drumherum sauber sortieren will, findet sie in den 7 Begriffen, die jeder Geschaeftsfuehrer kennen sollte, und den groesseren Rahmen im Agentic-AI-Crashkurs.
Baustein 1: Der Agent-Loop
Der Loop ist das Herzstueck. Alles andere haengt an ihm. Ein Agent arbeitet nicht in einem Durchlauf, sondern in einer Schleife aus vier Phasen, die sich wiederholen, bis das Ziel erreicht ist: wahrnehmen, planen, handeln, beobachten. Dann von vorn.
Wahrnehmen heisst: Der Agent erfasst den aktuellen Stand. Was ist die Aufgabe, was weiss ich schon, was ist das Ergebnis meiner letzten Aktion. Planen heisst: Er entscheidet, was der naechste sinnvolle Schritt ist. Handeln heisst: Er fuehrt diesen Schritt aus, meist ueber ein Werkzeug, dazu gleich mehr. Beobachten heisst: Er schaut sich das Ergebnis seiner Aktion an und nimmt es als neue Wahrnehmung in die naechste Runde mit. Diese Rueckkopplung ist der entscheidende Punkt. Der Agent reagiert auf das, was tatsaechlich passiert ist, nicht auf das, was er vorher geplant hatte.
Genau das aendert alles. Ein einzelner Durchlauf kann nur das, was in einem Schritt machbar ist. Eine Schleife kann sich an die Realitaet anpassen. Wenn ein Schritt fehlschlaegt, sieht der Agent das beim Beobachten und plant um. Wenn ein Zwischenergebnis eine neue Information liefert, baut er sie in den naechsten Plan ein. Ein Chatbot, der eine Rechnung pruefen soll und merkt, dass eine Position fehlt, kann nur sagen "da fehlt etwas". Ein Agent kann beim naechsten Schleifendurchlauf im System nachsehen, ob die Position storniert wurde, beim Lieferanten anfragen oder einen Menschen einbinden.
Das Rechnungsbeispiel durch den Loop gespielt: Runde eins, wahrnehmen, der Agent liest die eingegangene Rechnung. Planen, er entscheidet, die zugehoerige Bestellung zu suchen. Handeln, er fragt das ERP ab. Beobachten, er hat die Bestellung. Runde zwei, wahrnehmen, jetzt liegen Rechnung und Bestellung vor. Planen, vergleichen. Handeln, Positionen und Summen abgleichen. Beobachten, eine Position weicht um 240 EUR ab. Runde drei, planen, das ist eine Abweichung ueber dem Schwellwert, also nicht selbst korrigieren, sondern eskalieren. Handeln, eine Rueckfrage an die zustaendige Person mit Beleg. Ziel erreicht, Loop endet. Vier Bausteine waren im Spiel, aber der Loop hat sie orchestriert.
Baustein 2: Tools (Werkzeuge)
Ein Sprachmodell allein kann nur Text erzeugen. Es kann nichts abfragen, nichts speichern, nichts ausloesen. Tools, auf Deutsch Werkzeuge, sind genau das, was den Agenten aus dem Chat-Fenster herausholt und an deine Systeme andockt. Ein Tool ist eine klar definierte Aktion, die der Agent aufrufen kann: eine Datenbank abfragen, eine API aufrufen, eine Mail versenden, ein PDF auslesen, eine Berechnung in Code ausfuehren, einen Datensatz in einem System anlegen.
Technisch funktioniert das so: Der Agent bekommt eine Liste verfuegbarer Werkzeuge mit der Beschreibung, was jedes tut und welche Eingaben es braucht. Wenn das Modell im Planen-Schritt entscheidet, dass es jetzt eine Information aus dem ERP braucht, gibt es keinen Fliesstext aus, sondern einen strukturierten Werkzeug-Aufruf: "rufe Bestellung mit Nummer X ab". Das System fuehrt diesen Aufruf aus, gibt das Ergebnis zurueck, und der Agent verarbeitet es in der naechsten Loop-Runde. Das Modell selbst fuehrt nichts aus, es entscheidet nur, welches Werkzeug mit welchen Eingaben sinnvoll ist. Die Ausfuehrung passiert kontrolliert ausserhalb.
Diese Trennung ist auch sicherheitsrelevant: Du als Betreiber entscheidest, welche Werkzeuge ein Agent ueberhaupt bekommt und was sie duerfen. Ein Agent ohne Versand-Werkzeug kann keine Mail rausschicken, egal wie er argumentiert. Genau hier sitzt ein Grossteil der praktischen Kontrolle. Welche Angriffsflaeche dabei entsteht und wie man sie absichert, steht im Detail im Post zu Prompt Injection und Agent-Schutz.
Aus der Mittelstand-Realitaet, was Werkzeuge konkret sind: Der Lese-Zugriff auf das DMS, damit der Agent Vertraege und Belege findet. Die ERP-Schnittstelle fuer Bestell- und Lagerdaten. Der Kalender und das Mail-Postfach fuer Termin- und Korrespondenz-Aufgaben. Ein SQL-Zugriff auf das Data Warehouse fuer Reporting-Fragen. Eine Code-Ausfuehrung fuer Berechnungen, die ein Sprachmodell sonst unzuverlaessig macht. Je besser und sauberer die Werkzeuge angebunden sind, desto mehr kann ein Agent, und je grober sie definiert sind, desto fehleranfaelliger wird er. Werkzeuge sind kein Detail, sie sind die halbe Miete.
Baustein 3: Memory (Gedaechtnis)
Ein Agent ohne Gedaechtnis ist ein Werkzeug fuer Einmal-Aufgaben. Ein Agent mit Gedaechtnis wird zum Assistenten, der ueber Zeit nuetzlicher wird. Es gibt zwei Arten, und der Unterschied ist wichtig, weil er oft verwechselt wird.
Das Kurzzeit-Gedaechtnis ist der Arbeitsspeicher des laufenden Tasks. Es ist im Wesentlichen der Context, also das, was der Agent gerade im aktuellen Auftrag gesehen und getan hat: die Aufgabe, die bisherigen Schritte, die Ergebnisse der Werkzeug-Aufrufe. Dieses Gedaechtnis ist endlich. Es passt in das Context-Window des Modells, das Stand Mai 2026 bei produktiv eingesetzten Frontier-Modellen in der Groessenordnung von rund 100.000 bis ueber einer Million Token liegt (Groessenordnung, Stand Mai 2026, je nach Modell und Tier). Wenn ein Task sehr lang wird, fuellt sich dieser Speicher, und der Agent muss aelteres zusammenfassen oder verwerfen. Das ist eine echte technische Grenze, kein Detail.
Das Langzeit-Gedaechtnis ist das, was ueber den einzelnen Task hinaus erhalten bleibt. Es lebt ausserhalb des Modells, in einer Datenbank oder einem Dokument-Speicher, und der Agent holt sich zur Laufzeit gezielt heraus, was er braucht. Das ist mechanisch derselbe Ansatz wie bei einer Wissens-Anbindung ueber Retrieval, und genau dieser Vergleich lohnt sich: Die Mechanik dahinter ist im Post zu RAG, Fine-Tuning und Prompting ausgefuehrt. Im Langzeit-Gedaechtnis steht zum Beispiel: welche Lieferanten ueblicherweise welche Abweichungen produzieren, welche Eskalations-Schwellen dein Unternehmen gesetzt hat, oder welche Korrekturen ein Mensch in der Vergangenheit freigegeben hat.
Hier die ehrliche Grenze: Ein Agent "lernt" nicht im Sinne eines Menschen, der aus Erfahrung klueger wird. Das Sprachmodell selbst veraendert sich durch die Nutzung nicht. Was sich aufbaut, ist ein externer Speicher, den der Agent geschickt anzapft. Das ist enorm nuetzlich, aber es ist eine Datenbank-Mechanik, keine Magie. Wer "der Agent merkt sich alles und wird von selbst besser" verspricht, verkauft eine Illusion. Was real ist: Ein gut gebautes Langzeit-Gedaechtnis macht den Agenten konsistenter und reduziert Rueckfragen, weil er beim naechsten Mal nicht bei null anfaengt.
Baustein 4: Planning (Planung)
Planung ist die Faehigkeit, ein Ziel in eine sinnvolle Reihenfolge von Schritten zu zerlegen und diese Reihenfolge anzupassen, wenn die Realitaet dazwischenfunkt. Ein einfaches Beispiel ist kein Planning: "lies diese eine Mail und fasse sie zusammen" ist ein Schritt. Planning beginnt, wenn ein Ziel mehrere abhaengige Schritte braucht, deren Reihenfolge nicht von vornherein feststeht.
In der Praxis macht der Agent das im Planen-Schritt seines Loops. Er ueberlegt: Um ein Angebot zu erstellen, brauche ich zuerst die Kundendaten, dann die angefragten Positionen, dann die aktuellen Preise, dann die Marge-Regeln, dann das Dokument. Manche Schritte haengen voneinander ab, manche nicht. Gute Planung erkennt diese Abhaengigkeiten und arbeitet sie in der richtigen Reihenfolge ab. Und, der wichtigere Teil, sie passt sich an: Wenn der Preis-Schritt ergibt, dass eine Position nicht mehr lieferbar ist, plant der Agent um, statt stur weiterzulaufen.
Wo Planning Stand Mai 2026 gut funktioniert: bei klar umrissenen Zielen mit ueberschaubarer Schrittzahl, bei denen jeder Schritt ein nachpruefbares Ergebnis liefert. Rechnungspruefung, Angebots-Erstellung aus klaren Vorgaben, Datenrecherche mit definiertem Endpunkt, Report-Zusammenstellung. In diesen Faellen sind die Agenten 2026 belastbar.
Wo Planning noch bricht, und das gehoert ehrlich gesagt: bei sehr langen Ketten und bei mehrdeutigen Zielen. Je mehr Schritte aufeinander aufbauen, desto hoeher die Wahrscheinlichkeit, dass sich ein frueher Fehler durch die ganze Kette zieht. Und je unschaerfer das Ziel ("optimiere unseren Einkauf"), desto eher verzettelt sich der Agent oder trifft Annahmen, die du nicht teilst. Die Lehre ist nicht "Planning funktioniert nicht", sondern "Planning braucht ein scharf umrissenes Ziel und ueberschaubare Ketten". Wer das ignoriert, landet bei den ueblichen Enttaeuschungen, die der Post zu dem was AI-Agents heute nicht koennen im Detail behandelt.
Wie die 4 Bausteine zusammenspielen
Spielen wir die vier Bausteine an einem durchgaengigen Beispiel durch: ein Agent, der aus einer Kundenanfrage ein Angebot erstellt. Das zeigt, wie eng die Bausteine verzahnt sind, denn keiner funktioniert allein.
Die Anfrage kommt per Mail rein. Der Loop startet. Wahrnehmen: Der Agent liest die Anfrage, das ist sein Kurzzeit-Gedaechtnis fuer diesen Task. Planning: Er zerlegt das Ziel "Angebot erstellen" in Schritte, Kundendaten holen, Positionen klaeren, Preise ziehen, Marge pruefen, Dokument bauen. Handeln ueber Tools: Er fragt das CRM nach dem Kunden (Tool eins), das ERP nach Verfuegbarkeit und Listenpreisen (Tool zwei). Beobachten: Eine Position ist nicht lieferbar.
Jetzt zeigt sich der Wert des Zusammenspiels. Der Loop dreht eine Runde weiter, das Planning passt sich an: nicht abbrechen, sondern eine Alternativposition vorschlagen. Hier greift das Langzeit-Gedaechtnis: Der Agent weiss aus frueheren Vorgaengen, welche Ersatzposition dieser Kunde in der Vergangenheit akzeptiert hat. Er baut das Angebot (Tool drei, Dokument-Erzeugung) und stoppt vor dem letzten Schritt, dem Versand. Denn Versand ist eine irreversible Aktion gegenueber dem Kunden, also legt er das fertige Angebot einem Menschen zur Freigabe vor. Loop, Tools, Memory, Planning, alle vier waren im Spiel, und der eine fehlende Baustein, der bewusst weggelassene Versand-Automatismus, ist genauso wichtig wie die vier vorhandenen.
Was das fuer deine Erwartungen heisst
Wenn du die vier Bausteine verstanden hast, folgen daraus ein paar nuechterne Konsequenzen, die dir teure Enttaeuschungen ersparen.
Agenten brauchen drei Dinge, sonst funktionieren sie nicht: ein klares Ziel, Zugang zu den richtigen Werkzeugen und eine Moeglichkeit, ihr Ergebnis zu pruefen. Fehlt das Ziel, verzettelt sich das Planning. Fehlen die Werkzeuge, bleibt der Agent ein Chatbot. Fehlt die Pruefung, das Eval, weisst du nie, ob er gut arbeitet. Diese drei sind keine Kuer, sie sind die Voraussetzung.
Agenten sind nicht magisch, sie sind orchestrierte Mechanik. Loop, Werkzeug-Aufrufe, Datenbank-Speicher, Schritt-Zerlegung. Das ist beeindruckend leistungsfaehig, aber es ist nachvollziehbar und damit auch steuerbar. Wer es als Magie behandelt, kann es weder absichern noch sinnvoll begrenzen.
Agenten brechen bei mehrdeutigen Zielen, nicht bei schweren. Eine komplexe, aber klar definierte Aufgabe loesen sie zuverlaessiger als eine einfache, aber vage formulierte. Das ist kontraintuitiv und der haeufigste Grund, warum Piloten enttaeuschen. Wie sich dieses Muster in echte Projektfehler uebersetzt, zeigen die 5 Architekturfehler von Pilot zu Production und der Pilot-Friedhof.
Und der wichtigste Punkt: Bei irreversiblen Aktionen gehoert ein Mensch in die Schleife. Geld ueberweisen, Mails an Kunden senden, Datensaetze loeschen, Vertraege abschliessen, das sind Aktionen, die man nicht zurueckholt. Hier ist Human-in-the-Loop kein Misstrauen gegenueber der Technik, sondern saubere Architektur. Was diese Autonomie ueber 12 Monate kostet und welche laufenden Posten dahinterstecken, rechnet der TCO-Post durch.
FAQ
Ist ein KI-Agent dasselbe wie GPT mit Plugins?
Nein, aber die Verwechslung ist verstaendlich, weil Plugins ein Vorlaeufer der Werkzeug-Idee sind. Ein Plugin gibt einem Chatbot Zugriff auf eine externe Funktion, das ist der Werkzeug-Baustein. Was fehlt, ist der Loop: Ein Plugin-Aufruf ist meist ein einzelner Durchlauf, der Agent dagegen ruft Werkzeuge wiederholt auf, beobachtet die Ergebnisse und plant um. Erst Loop plus Werkzeuge plus Gedaechtnis plus Planning machen aus einem werkzeugfaehigen Chatbot einen Agenten. Plugins sind ein Baustein von vieren, nicht das Ganze.
Braucht jeder Use-Case einen Agenten?
Nein, und das ist eine der wichtigsten Erkenntnisse. Viele Aufgaben sind Einmal-Durchlaeufe ohne Schleifenbedarf: eine Mail zusammenfassen, einen Text klassifizieren, eine Frage auf einem gegebenen Dokument beantworten. Dafuer ist ein Agent ueberdimensioniert, ein einfacher Modell-Aufruf reicht und ist billiger, schneller und leichter zu kontrollieren. Die Faustregel: Ein Agent lohnt sich erst, wenn eine Aufgabe mehrere abhaengige Schritte, echte Aktionen ueber Werkzeuge und eine Anpassung an Zwischenergebnisse braucht. Sonst ist die Schleife nur unnoetige Komplexitaet.
Wie autonom sollte ein Agent sein?
So autonom wie noetig, so kontrolliert wie moeglich, und die Grenze verlaeuft entlang der Umkehrbarkeit. Lesende und vorbereitende Schritte (Daten holen, vergleichen, einen Entwurf bauen) kann ein Agent weitgehend autonom machen. Irreversible Aktionen gegenueber Geld, Kunden oder Datenbestand gehoeren hinter eine menschliche Freigabe. Autonomie ist kein Schalter auf "ganz oder gar nicht", sondern eine Abstufung pro Aktionstyp. Wer das pauschal regelt, baut entweder einen nutzlosen oder einen gefaehrlichen Agenten.
Was ist der haeufigste Denkfehler?
Der Glaube, ein vageres Ziel mache den Agenten flexibler. Das Gegenteil stimmt. Ein scharf umrissenes Ziel ("pruefe diese Rechnung gegen die Bestellung und eskaliere Abweichungen ueber 100 EUR") loest ein Agent zuverlaessig. Ein vages Ziel ("kuemmer dich um unsere Rechnungen") laesst sein Planning ins Leere laufen, weil es keine pruefbaren Schritte ableiten kann. Klarheit ist kein Korsett, sie ist die Bedingung dafuer, dass Loop und Planning ueberhaupt arbeiten koennen.
Lernt der Agent aus jeder Aufgabe dazu?
Nicht im menschlichen Sinn. Das Sprachmodell selbst veraendert sich durch die Nutzung nicht. Was "dazulernt", ist das externe Langzeit-Gedaechtnis: ein Speicher, in den Ergebnisse, Entscheidungen und Muster geschrieben und beim naechsten Mal wieder abgerufen werden. Das macht den Agenten ueber Zeit konsistenter, ist aber Datenbank-Mechanik, nicht Selbst-Verbesserung des Modells. Wer mehr verspricht, ueberverkauft.
Sources:
- Sentient-Dynamics-Workshop-Aggregate, 40 DACH-Workshops 2025-2026 (Mitarbeiterzahl 80 bis 4.000)
- Bitkom KI-Studie 2025 (deutsche Unternehmen mit 20+ MA: 41 Prozent Adoption; deutsche Unternehmen ab 500 MA: 89 Prozent Adoption)
- McKinsey State of AI, November 2025
- Gartner Press Release, Juni 2025
- MIT NANDA Report 2025: "GenAI Divide: State of AI in Business 2025"
Naechster Schritt: Wenn du fuer einen konkreten Prozess herausfinden willst, ob ein Agent der richtige Ansatz ist oder ein einfacher Modell-Aufruf reicht, buch dir 30 Minuten ueber unsere Demo-Seite. Wir bringen die vier Bausteine, eine ehrliche Einschaetzung und drei Fragen, kein Vendor-Deck. Wer den Unterschied zu klassischer Automatisierung verstehen will, findet ihn im Post zu KI-Agent vs RPA vs Automatisierung, und wer wissen will, woran die meisten Agent-Projekte scheitern, im Ueberblick zu den Anti-Pattern hinter 40 Prozent gescheiterten Projekten.
Über den Autor
Sebastian Lang
Co-Founder · Business & Content Lead
Co-Founder von Sentient Dynamics. 15+ Jahre Business-Strategie (u.a. SAP), MBA. Schreibt über AI-Act-Compliance, ROI-Messung und wie Mittelstand-CTOs agentische KI tatsächlich einführen.