Make, Buy oder Partner: KI-Agenten Beschaffung 2026

Cloud-API €37/Monat vs eigene Hardware €1750+. 5 Entscheidungs-Achsen für Make/Buy/Partner bei KI-Agenten im DACH-Mittelstand 2026, plus Decision-Tree und Kosten-Schätzung.

Schlüsselzahlen auf einen Blick

Cloud-API €37 pro Monat vs eigene GPU-Hardware €1.750 plus Strom bei leichter Nutzung (unter 1 Mio Token pro Tag). Bei dieser Größenordnung ist Cloud betriebswirtschaftlich klar überlegen.
30.000 bis 80.000 Euro typisches Pilotbudget für extern gebauten Agent in DACH-Mittelstand 2026, 90.000 bis 200.000 Euro für Skalierung. Internes Build kostet bei 1-zu-1-Vergleichbarkeit 30 bis 50 Prozent mehr Brutto-Engineering-Zeit.
1 von 10 ist die Erfolgsquote rein interner Agent-Builds in DACH-Mittelstand 2026 ohne externe Begleitung. Hauptgründe: Skill-Library-Architektur und KPI-Messung fehlen im internen Repertoire.
8 bis 12 Wochen realistischer Zeitrahmen für belastbaren Pilot, 6 Monate für Production-Skalierung. Wer in 4 Wochen produktiv sein will, hat entweder einen sehr engen Use-Case oder skippt Pre-Production-Checks (siehe Architekturfehler-Post).
3 typische Mittelstand-Modelle: SaaS-Agent vom Vendor (€199-2000/Monat), externer Implementation-Partner (€30-200k Engagement), internes Build (€80-300k Initial-Investition plus laufender FTE-Kost).

Wenn Sie als Geschäftsführer, CTO oder Head of Operations im DACH-Mittelstand 2026 über die Beschaffung eines ersten KI-Agenten entscheiden, stehen Sie vor der Make-Buy-Partner-Frage. Die Antwort ist nicht ideologisch ("wir wollen unabhängig sein" oder "wir wollen schnell sein"), sondern entlang von 5 Entscheidungs-Achsen. Dieser Post liefert die Achsen, einen Decision-Tree, und eine Kosten-Schätzung pro Modell aus DACH-Mittelstand-Engagement-Praxis 2026.

Wichtig vorab: die drei Optionen sind nicht exklusiv. In den meisten unserer 2026-Engagements sehen wir Mix-Modelle: SaaS-Agent für Standard-Workflows, externer Partner für Custom-Implementation, internes Team für Skill-Library-Pflege und KPI-Messung. Die Frage ist nicht "welches Modell", sondern "welche Anteile pro Use-Case".

Wer dieser Post ist und wer nicht

Dieser Post richtet sich an Entscheider im DACH-Mittelstand (30 bis 500 FTE), die einen Use-Case identifiziert haben (siehe unsere 90-Tage-Use-Case-Matrix) und vor der Beschaffungs-Entscheidung stehen. Konkret: Sie haben ein Use-Case-Charter, ein Pilotbudget zwischen 30.000 und 200.000 Euro, und Sie müssen jetzt entscheiden, ob Sie einen SaaS-Agent kaufen, einen externen Partner beauftragen, oder intern bauen.

Nicht passend ist der Post für Konzerne über 500 FTE mit dezidiertem AI-Engineering-Team. Für die ist die Make-Decision oft default-rational, weil die FTE-Kosten anders skalieren.

Die 5 Entscheidungs-Achsen

Achse 1: Standardisierungsgrad des Use-Cases. Standard-Use-Cases (Eingangsrechnung, Mail-Triage, Standard-Outreach) haben fertige SaaS-Agenten am Markt. Nicht-Standard-Use-Cases (branchenspezifische Workflows, eigene Datenmodelle, regulierte Sonderprozesse) brauchen Custom-Implementation, weil SaaS-Agenten 60-Prozent-Coverage erreichen aber die kritischen 40 Prozent nicht abdecken.

Achse 2: Datenhoheit-Anforderungen. Use-Cases mit Standard-Daten (öffentliche Information, Standard-CRM-Daten) sind Cloud-API-tauglich. Use-Cases mit sensiblen Daten (Patientendaten, Finanzdaten regulierter Branchen, Engineering-IP) brauchen On-Premise oder dedizierte EU-Cloud-Hosting-Konstellationen, was die Make-Option attraktiver macht.

Achse 3: Time-to-Value. Wenn Sie in 6 Monaten produktiv sein müssen, ist Buy oder Partner default-Empfehlung, weil internes Build typisch 9 bis 18 Monate Time-to-First-Production braucht. Wenn Sie 12 bis 24 Monate Zeit haben und strategisch unabhängig sein wollen, lohnt Make-Investition.

Achse 4: Skill-Verfügbarkeit intern. Haben Sie aktuell mindestens 1 Senior-Engineer mit AI-Engineering-Erfahrung (LangGraph, Claude Agent SDK, MCP, OpenAI Assistants API), der für 12 bis 18 Monate dediziert verfügbar ist? Wenn nein, ist Make eine mehrere-Hunderttausend-Euro-Wette ohne ausreichende interne Kapazität. Wenn ja, lohnt es sich für strategische Use-Cases.

Achse 5: Strategische Differenzierung. Ist der Use-Case ein Differenzierungs-Faktor gegenüber Wettbewerbern (eigener Customer-Service-Agent als USP, eigene Engineering-Pipeline-Optimierung)? Dann ist Make langfristig wertvoll. Ist der Use-Case eine Standard-Effizienz-Optimierung (Eingangsrechnung, Reise-Buchung, Standard-Reporting)? Dann ist Buy default-rational, weil die Differenzierung nicht im Workflow sondern im Kerngeschäft liegt.

Modell 1: SaaS-Agent vom Vendor (Buy)

Was es ist: Sie kaufen einen vorgefertigten Agenten vom Vendor (z.B. Salesforce Agentforce, ServiceNow AI Agents, branchenspezifische Anbieter), konfigurieren ihn auf Ihre Datenflüsse, und nutzen ihn als Service.

Kosten 2026 in DACH-Mittelstand:

Lizenzkosten: typisch €199 bis €2.000 pro Monat pro Agent oder pro 100 bis 500 Aktionen
Setup-Kosten: typisch €5.000 bis €30.000 für initiale Konfiguration
Versteckte Kosten: API-Token-Kosten bei höherer Nutzung (kann von €37/Monat auf €2.000+/Monat skalieren), Skill-Library-Build (siehe unseren Cost-Spike-Post), Compliance-Setup, Onboarding-Workshops

Wann es passt: Standard-Use-Cases (Achse 1 Standard), niedrige Datensensitivität (Achse 2), schneller Time-to-Value (Achse 3 unter 6 Monate), keine internen AI-Skills (Achse 4 nein), keine strategische Differenzierung (Achse 5 Effizienz).

Wann es nicht passt: Custom-Workflows die SaaS-Coverage nicht erreichen, regulierte Datenflüsse die Vendor-Cloud nicht zulässt, Use-Cases die Differenzierungs-Wert haben.

Risiken: Vendor-Lockin (Migration kostet 4 bis 12 Wochen Engineering wenn überhaupt möglich), Pricing-Änderungen (Vendor erhöht Preise alle 6 bis 12 Monate), Roadmap-Abhängigkeit (was Vendor nicht baut, kommt nicht).

Praktischer Hinweis: SaaS-Agenten sind 2026 in vielen Standard-Domains schon sehr gut. Wenn 70 Prozent Ihrer Use-Cases Standard sind, sollten Sie SaaS evaluieren bevor Sie Make-Investment in Erwägung ziehen.

Modell 2: Externer Implementation-Partner (Partner)

Was es ist: Sie beauftragen einen externen Implementation-Partner (Beratung, Boutique-AI-Firma, oder spezialisierter Vendor wie Sentient Dynamics) für Custom-Implementation eines Agenten in Ihren Stack. Der Partner baut, übergibt Ownership nach 6 bis 12 Monaten an Ihr Team.

Kosten 2026 in DACH-Mittelstand:

Pilot-Engagement: typisch €30.000 bis €80.000 für 90-Tage-Pilot
Production-Skalierung: typisch €90.000 bis €200.000 für 3 bis 5 Workflows
Laufende Wartung: typisch €30.000 bis €80.000 pro Jahr für Skill-Library-Pflege, Drift-Monitoring, Modell-Updates
Erfolgs-basierte Modelle: einige Partner (inkl. Sentient) bieten Output-gemessene Vergütung an, das senkt Initial-Risiko

Wann es passt: Mittel- bis hohe Custom-Anforderungen (Achse 1 Custom), mittlere Datensensitivität (Achse 2), Time-to-Value 6 bis 9 Monate (Achse 3), keine ausreichenden internen Skills (Achse 4 nein), strategische Use-Cases mit langfristigem Internalisierungs-Plan (Achse 5).

Wann es nicht passt: Pure Standard-Use-Cases (SaaS ist günstiger und schneller), reine Make-Strategie wo interne Hoheit absolute Voraussetzung ist.

Risiken: Partner-Lockin wenn Übergabe an internes Team nicht ordentlich gemacht wird, Wissen-Verlust bei Partner-Wechsel, Qualitätsschwankungen zwischen verschiedenen Partner-Engagements.

Praktischer Hinweis: Partner-Modelle funktionieren am besten mit klarer Übergabe-Klausel: nach 6 bis 12 Monaten produktive Phase übernimmt Ihr internes Team die Ownership der Skill-Library, der Partner bleibt als Sparring-Ressource für Eskalationen. So vermeiden Sie Partner-Lockin und bauen interne Capability auf.

Modell 3: Internes Build (Make)

Was es ist: Sie bauen den Agenten mit Ihrem internen Engineering-Team, typisch mit 1 Senior-Engineer mit AI-Erfahrung plus 2 bis 3 Junior- bis Mid-Level-Devs. Open-Source-Frameworks (LangGraph, AutoGen, Claude Agent SDK), eigene Skill-Library, eigene Permissions-Architektur.

Kosten 2026 in DACH-Mittelstand:

Initial-Investition: typisch €80.000 bis €300.000 für 6 bis 12 Monate Build-Phase, abhängig von Use-Case-Komplexität und Engineering-FTE-Kost
Laufende Kosten: typisch 1 bis 2 FTE für Skill-Library-Pflege, Modell-Monitoring, Drift-Detection (€100.000 bis €240.000 pro Jahr)
Cloud- oder On-Premise-Infrastruktur: €5.000 bis €50.000 pro Jahr für Cloud-API-Tokens, oder €50.000 bis €200.000 für eigene GPU-Infrastruktur
Versteckte Kosten: Senior-Engineer-Opportunitätskosten (was hätte er sonst gemacht), Onboarding-Zeit für neue Team-Mitglieder, Engineering-Plan-Verzicht auf andere Initiativen

Wann es passt: Hoch-Custom-Workflows (Achse 1 Custom), hohe Datensensitivität (Achse 2), Time-to-Value 12 bis 24 Monate akzeptabel (Achse 3), starke interne AI-Skills (Achse 4 ja), strategische Differenzierung (Achse 5 USP).

Wann es nicht passt: Standard-Use-Cases (SaaS ist 10x günstiger), kein internes AI-Senior verfügbar, schneller Time-to-Value gefordert.

Risiken: Time-to-Value oft 50 bis 100 Prozent länger als geplant (typisch 18 statt 12 Monate), Senior-Engineer-Risiko bei Personal-Wechsel, Skill-Library-Tech-Debt wenn keine externe Pattern-Erfahrung einfließt.

Praktischer Hinweis: In 1 von 10 Fällen funktioniert reines Make ohne externe Begleitung in DACH-Mittelstand 2026. Hauptgründe: Skill-Library-Architektur und KPI-Messung sind spezifisches Know-how aus mehreren Production-Rollouts, das interne Teams typisch nicht haben. Make plus externes Sparring (1 bis 2 Tage pro Quartal) ist deutlich erfolgreicher als reines Make.

Decision-Tree: Welches Modell für welche Situation?

Aus DACH-Mittelstand-Engagement-Praxis 2026 dieser Decision-Tree als Orientierung:

Frage 1: Ist der Use-Case Standard (Eingangsrechnung, Mail-Triage, Lager-Monitoring, Standard-Outreach)?

Ja → Frage 2
Nein → Frage 3

Frage 2 (für Standard): Brauchen Sie On-Premise oder ist Cloud akzeptabel?

Cloud akzeptabel → SaaS-Agent ist erste Wahl. Wenn SaaS-Coverage über 70 Prozent → buy. Wenn unter 70 Prozent → Partner für Custom-Anpassung.
On-Premise nötig → Partner mit On-Premise-Erfahrung, oder Make wenn interne AI-Skills vorhanden.

Frage 3 (für Custom): Haben Sie internen AI-Senior mit 12 plus Monaten Verfügbarkeit?

Ja → Make plus externes Sparring ist optimal. Senior baut, externes Sparring bringt Pattern-Wissen.
Nein → Partner ist die default-Empfehlung. Übergabe-Klausel nach 6 bis 12 Monaten an internes Team einplanen.

Frage 4 (für strategische Use-Cases): Ist der Use-Case ein Differenzierungs-Faktor?

Ja → Make oder Partner mit Internalisierungs-Plan. Niemals SaaS, weil Sie sich von Vendor-Roadmap abhängig machen.
Nein → Bevorzugen Sie SaaS, sparen Sie Engineering-Zeit für Differenzierungs-Use-Cases.

60-Minuten-Sparring zu Ihrer Make-Buy-Partner-Entscheidung →

Mix-Modelle aus DACH-Mittelstand-Praxis 2026

In den meisten unserer 2026-Engagements sehen wir nicht reine Make-, Buy- oder Partner-Strategien, sondern Mix-Modelle. Drei typische Konstellationen:

Mix 1: SaaS für Effizienz, Partner für Differenzierung. Eingangsrechnung und Mail-Triage über SaaS-Agenten (Buy), eigener Customer-Service-Agent über Partner mit Internalisierungs-Plan (Partner-zu-Make). Vorteil: schneller ROI bei Standard-Workflows, langfristige Differenzierung beim USP-Workflow.

Mix 2: Partner für Initial-Build, Make für laufende Pflege. Erster Use-Case wird mit Partner gebaut, Skill-Library und Permissions-Architektur sind aufgebaut. Nach 9 bis 12 Monaten übernimmt internes Team die Ownership und baut weitere Use-Cases auf der bestehenden Architektur. Vorteil: schneller erster Erfolg, dann interne Capability ohne Vendor-Lockin.

Mix 3: Hybrid-Cloud mit Partner-Sparring. Standard-Workflows nutzen Cloud-APIs (OpenAI, Anthropic, Google), sensible Workflows laufen auf On-Premise-Open-Source-Modellen (Llama, Mistral). Partner liefert Pattern-Wissen und Architektur-Sparring, internes Team baut und betreibt. Vorteil: Datenhoheit bei sensiblen Daten, Kosten-Effizienz bei Standard-Daten.

Häufige Fragen

Was ist mit den großen Beratungen (McKinsey, BCG, Capgemini, Accenture)? Die haben Agenten-Implementation-Praxis, aber typisch hohe Listenpreise (€500 bis €2.000 pro Tag pro Berater plus Premium-Faktoren) und wenig DACH-Mittelstand-Spezifik. Für 500-plus-FTE-Organisationen kann das Sinn ergeben, für 30-200-FTE-Mittelstand sind kleinere spezialisierte Partner typisch effizienter.

Lohnt sich Open-Source ab 2026 wirklich? Für viele Use-Cases ja. Llama, Mistral, DeepSeek erreichen 2026 Production-Qualität für Standard-Workflows, mit Datenhoheit-Vorteil und niedrigeren Variable-Kosten. Trade-off: höhere Fixkosten für GPU-Infrastruktur, langsamere Modell-Updates, weniger Tool-Integration. Break-Even gegenüber Cloud-API-Kosten typisch ab 5 bis 10 Mio Token pro Tag, was für die meisten Mittelstand-Workflows noch zu viel ist.

Was kostet eine schlechte Make-Entscheidung? In unseren 2026-Engagements sehen wir typische Costs einer abgebrochenen internen Build-Initiative: 6 bis 12 Monate Engineering-Zeit (€60.000 bis €200.000 FTE-Kost), Opportunitätskosten anderer Initiativen, plus die Re-Investition für Partner-Pivot oder SaaS-Switch. Total typisch €150.000 bis €400.000 für eine Make-Entscheidung, die nach 12 Monaten als gescheitert revidiert wird.

Was kostet eine schlechte Buy-Entscheidung? Typisch geringer als schlechte Make-Entscheidung: SaaS-Subscription kann gekündigt werden, Setup-Kosten von €5.000 bis €30.000 sind verloren. Aber: 6 bis 12 Monate Lock-in mit unzureichendem Tool, plus Re-Investment für besseres Tool. Total typisch €50.000 bis €120.000.

Wie überprüfe ich, ob ein Partner gut ist? Vier Fragen aus unserer Procurement-Beratung: (1) Wie viele Production-Engagements im DACH-Mittelstand haben sie abgeschlossen? (2) Welche Pre-Post-KPI-Daten können sie zeigen? (3) Wie ist die Übergabe-Klausel an internes Team formuliert? (4) Welche Vendoren-Diversität kennen sie (nur Anthropic, oder auch OpenAI, Google, Open-Source)? Mehr Detail im Bullshit-Trainings-Post, die Pre-Procurement-Checkliste gilt analog für Agent-Implementation.

Was ist Agentic AI? Der Geschäftsführer-Crashkurs →

Quellen

Über den Autor

Sebastian Lang ist Co-Founder von Sentient Dynamics und leitet das Agentic-University-Programm. Vor Sentient war er bei SAP in der Strategy-Practice für KI-Workforce-Programme verantwortlich, mit 15 plus Jahren Engineering-Leadership-Erfahrung. Sentient Dynamics arbeitet mit erfolgsbasierter Vergütung und ist im SHD- sowie Bregal-Portfolio im Einsatz.

Newsletter abonnieren | Sebastian auf LinkedIn

Make, Buy oder Partner: KI-Agenten-Beschaffung für DACH-Geschäftsführer 2026

Schlüsselzahlen auf einen Blick

Wer dieser Post ist und wer nicht

Die 5 Entscheidungs-Achsen

Modell 1: SaaS-Agent vom Vendor (Buy)

Modell 2: Externer Implementation-Partner (Partner)

Modell 3: Internes Build (Make)

Decision-Tree: Welches Modell für welche Situation?

Mix-Modelle aus DACH-Mittelstand-Praxis 2026

Häufige Fragen

Quellen

Über den Autor

Weiterlesen

Vom KI-Pilot in Production: 5 Architekturfehler die Agenten-Projekte im Mittelstand killen

Welcher erste KI-Agent? Die 90-Tage-Use-Case-Matrix für DACH-Mittelstand 2026

5 KI-Trainings-Versprechen, die 2026 in DACH gefährlich Bullshit sind (und was stattdessen funktioniert)

Einmal im Monat. Nur Substanz.