KI-Implementierung — vom Pilot zur produktiven Lösung.
Wir bauen mit dir konkrete KI-Anwendungen: RAG auf eigenen Daten, Voice Agents, Workflow-Automatisierung. Sauber dokumentiert, übergebbar, ohne Vendor-Lock-In.
Was du bekommst
Implementierung bedeutet bei uns: Wir bauen mit deinem Team eine konkrete, produktiv einsetzbare KI-Lösung. Keine Black-Box, kein Vendor-Lock-In, kein "danach brauchst du uns für immer".
Standard-Lieferumfang:
- Discovery (Woche 1–2): Detaillierte Anforderungsaufnahme, Modellwahl, Architektur-Entscheidung, Datenschutz-Konzept.
- Prototyp (Woche 3–6): Funktionsfähiger Prototyp auf einer überschaubaren Datenbasis. Demo am Ende der Phase.
- Produktivierung (Woche 7–12): Skalierung auf vollen Datenbestand, Monitoring, Logging, Berechtigungen, CI/CD light.
- Übergabe und Hand-Holding: 4 Wochen Bereitschaft nach Go-Live, Doku, Runbook für dein IT-Team.
Wir arbeiten mit deinem Stack — nicht gegen ihn. Wenn du M365 hast, integrieren wir uns in M365. Wenn du Google Workspace nutzt, kommt die Lösung dort an. Wenn du auf-Premise sein musst, bauen wir auf-Premise.
Was wir bauen
RAG-Stacks
Eigene Wissensbasis suchbar machen — Confluence, SharePoint, Tickets, Mails, PDFs. Mit pgvector, Qdrant oder Weaviate.
Voice Agents
Telefon-KI, die Erstgespräche führt, Termine vereinbart oder Anliegen klassifiziert — DSGVO-konform mit EU-Hosting.
Workflow-Automatisierung
n8n, Make, Zapier mit LLM-Schritten. Mail-Triage, Ticket-Routing, Lead-Qualifizierung — automatisiert.
Coding-Agents
Claude Code und OpenAI Codex im Entwicklungsalltag deines Teams ausrollen. Mit Datenschutz-konformen Setups.
Tiefere Hintergründe zu den Stacks: Embeddings & RAG erklärt, Voice Agents, Claude Code & Codex, Lokale KI, Cloud-KI · Azure.
Ablauf
Typisches Implementierungsprojekt dauert 8–16 Wochen. Vorgehen ist iterativ:
- Kickoff (1 Tag): Klärung von Scope, Datenfluss, Berechtigungen, Akzeptanzkriterien.
- Architecture Decision (3–5 Tage): Modellwahl (z.B. Claude 4 vs. Llama 4 self-hosted), Hosting-Konzept, Sicherheits-Setup. Schriftlicher Architekturentscheid.
- Sprint 1–2 (4 Wochen): Prototyp mit Kern-Use-Case. Wöchentliche Demos.
- Sprint 3–4 (4 Wochen): Skalierung, Monitoring, Berechtigungen, Edge Cases.
- Übergabe (1–2 Wochen): Doku, Schulung deines Teams, Runbook, 30-Tage-Wartungsbereitschaft inklusive.
Stack-Entscheidungen treffen wir nicht ideologisch. Sondern abhängig von Datenschutz-Anforderungen, Budget, Skill-Level deines Teams und strategischer Roadmap. Was sinnvoll ist, machen wir — auch wenn das mal "nur" ein simples Make-Workflow ist.
Was es kostet
Implementierung wird auf Tagessatz-Basis abgerechnet. Senior-Tagessatz 1.800–2.200 € netto, je nach Tech-Stack-Anforderung.
Typische Projekt-Größen:
- Pilot-RAG für interne Wissenssuche: 8–12 Wochen, 25.000–45.000 € netto inkl. Setup, Testing, Übergabe
- Voice-Agent für Telefon-Eingang: 6–10 Wochen, 18.000–32.000 € netto inkl. Telefonie-Integration
- Workflow-Automatisierung mit LLM (n8n/Make): 3–6 Wochen, 9.000–18.000 € netto je nach Workflow-Anzahl
- Lokale LLM-Infrastruktur (auf VPS oder eigener Hardware): 4–8 Wochen, 14.000–28.000 € netto inkl. Modell-Auswahl, Hardware-Beratung, Deployment
Wo Festpreise sinnvoll sind, bieten wir Festpreise. Wo der Umfang noch zu unklar ist, arbeiten wir mit T&M-Cap (Time & Materials mit Obergrenze). Wir machen keine Lust-Gewinn-Verträge.
Häufige Fragen
Welches Modell empfehlt ihr typischerweise?
Hängt vom Use-Case ab. Für reines Sprachverständnis und Texterstellung im DACH-Raum oft Claude 4 Sonnet (sauberes Deutsch, gute Datenschutz-Optionen). Für Code Claude Code oder OpenAI Codex. Für Self-Hosting Llama 4 oder Mistral Large. Wir entscheiden je nach Anforderung.
Können wir das selbst weiterentwickeln nach Übergabe?
Genau das ist das Ziel. Wir liefern dokumentierten Code, Architektur-Diagramme und ein Runbook. Wenn dein Team Python kann, kommt es nach 2–4 Wochen Hand-Holding gut zurecht.
Was ist mit MLOps?
Wir machen MLOps light: Logging, Monitoring (z.B. Langfuse oder Datadog), Cost-Tracking, einfache Tests. Vollständiges MLOps mit A/B-Testing-Plattformen ist meist Overkill für Mittelstand-Projekte.
Wie ist die Datenschutz-Lage bei euch?
Wir unterzeichnen NDAs, arbeiten mit Auftragsverarbeitungsverträgen (AVV), und bei besonders sensiblen Daten kommen wir auf eure Infrastruktur (VPN, Bastion-Hosts). Mehr dazu auf <a href='/recht-ethik/datenschutz'>/recht-ethik/datenschutz</a>.
Können wir Festpreis bekommen?
Bei klar abgegrenzten Workflow-Automatisierungen ja. Bei größeren RAG- oder Voice-Projekten meist T&M-Cap, weil der Umfang während der Discovery-Phase noch konkretisiert wird. Wir geben dir vor Vertragsabschluss eine Range mit Best/Worst Case.
Wer übernimmt nach Go-Live den Betrieb?
Standardmäßig dein Team (mit Doku und Runbook). Optional bieten wir Wartungs-Retainer an: 4h/Monat 1.200 €, 8h/Monat 2.200 €, 16h/Monat 4.000 €. Damit ist der KI-Stack auch im Krisenfall in 24h reaktiviert.

Patrick — Senior Social Media & GEO Manager
Patrick ist dein erster Ansprechpartner für KI-Beratung, Workshops und Implementierung. Er hört zu, fragt nach — und sortiert für dich, was wirklich Hebel hat.
30 Min · kostenfrei · unverbindlich