Leistung · Implementierung

KI-Implementierung — vom Pilot zur produktiven Lösung.

Wir bauen mit dir konkrete KI-Anwendungen: RAG auf eigenen Daten, Voice Agents, Workflow-Automatisierung. Sauber dokumentiert, übergebbar, ohne Vendor-Lock-In.

Projekt anfragen Stacks ansehen

Was du bekommst

Implementierung bedeutet bei uns: Wir bauen mit deinem Team eine konkrete, produktiv einsetzbare KI-Lösung. Keine Black-Box, kein Vendor-Lock-In, kein "danach brauchst du uns für immer".

Standard-Lieferumfang:

Discovery (Woche 1–2): Detaillierte Anforderungsaufnahme, Modellwahl, Architektur-Entscheidung, Datenschutz-Konzept.
Prototyp (Woche 3–6): Funktionsfähiger Prototyp auf einer überschaubaren Datenbasis. Demo am Ende der Phase.
Produktivierung (Woche 7–12): Skalierung auf vollen Datenbestand, Monitoring, Logging, Berechtigungen, CI/CD light.
Übergabe und Hand-Holding: 4 Wochen Bereitschaft nach Go-Live, Doku, Runbook für dein IT-Team.

Wir arbeiten mit deinem Stack — nicht gegen ihn. Wenn du M365 hast, integrieren wir uns in M365. Wenn du Google Workspace nutzt, kommt die Lösung dort an. Wenn du auf-Premise sein musst, bauen wir auf-Premise.

Was wir bauen

Anwendung

RAG-Stacks

Eigene Wissensbasis suchbar machen — Confluence, SharePoint, Tickets, Mails, PDFs. Mit pgvector, Qdrant oder Weaviate.

Telefonie

Voice Agents

Telefon-KI, die Erstgespräche führt, Termine vereinbart oder Anliegen klassifiziert — DSGVO-konform mit EU-Hosting.

Operations

Workflow-Automatisierung

n8n, Make, Zapier mit LLM-Schritten. Mail-Triage, Ticket-Routing, Lead-Qualifizierung — automatisiert.

Tech

Coding-Agents

Claude Code und OpenAI Codex im Entwicklungsalltag deines Teams ausrollen. Mit Datenschutz-konformen Setups.

Tiefere Hintergründe zu den Stacks: Embeddings & RAG erklärt, Voice Agents, Claude Code & Codex, Lokale KI, Cloud-KI · Azure.

Ablauf

Typisches Implementierungsprojekt dauert 8–16 Wochen. Vorgehen ist iterativ:

Kickoff (1 Tag): Klärung von Scope, Datenfluss, Berechtigungen, Akzeptanzkriterien.
Architecture Decision (3–5 Tage): Modellwahl (z.B. Claude 4 vs. Llama 4 self-hosted), Hosting-Konzept, Sicherheits-Setup. Schriftlicher Architekturentscheid.
Sprint 1–2 (4 Wochen): Prototyp mit Kern-Use-Case. Wöchentliche Demos.
Sprint 3–4 (4 Wochen): Skalierung, Monitoring, Berechtigungen, Edge Cases.
Übergabe (1–2 Wochen): Doku, Schulung deines Teams, Runbook, 30-Tage-Wartungsbereitschaft inklusive.

Stack-Entscheidungen treffen wir nicht ideologisch. Sondern abhängig von Datenschutz-Anforderungen, Budget, Skill-Level deines Teams und strategischer Roadmap. Was sinnvoll ist, machen wir — auch wenn das mal "nur" ein simples Make-Workflow ist.

Was es kostet

Implementierung wird auf Tagessatz-Basis abgerechnet. Senior-Tagessatz 1.800–2.200 € netto, je nach Tech-Stack-Anforderung.

Typische Projekt-Größen:

Pilot-RAG für interne Wissenssuche: 8–12 Wochen, 25.000–45.000 € netto inkl. Setup, Testing, Übergabe
Voice-Agent für Telefon-Eingang: 6–10 Wochen, 18.000–32.000 € netto inkl. Telefonie-Integration
Workflow-Automatisierung mit LLM (n8n/Make): 3–6 Wochen, 9.000–18.000 € netto je nach Workflow-Anzahl
Lokale LLM-Infrastruktur (auf VPS oder eigener Hardware): 4–8 Wochen, 14.000–28.000 € netto inkl. Modell-Auswahl, Hardware-Beratung, Deployment

Wo Festpreise sinnvoll sind, bieten wir Festpreise. Wo der Umfang noch zu unklar ist, arbeiten wir mit T&M-Cap (Time & Materials mit Obergrenze). Wir machen keine Lust-Gewinn-Verträge.

Häufige Fragen

Welches Modell empfehlt ihr typischerweise?

Hängt vom Use-Case ab. Für reines Sprachverständnis und Texterstellung im DACH-Raum oft Claude 4 Sonnet (sauberes Deutsch, gute Datenschutz-Optionen). Für Code Claude Code oder OpenAI Codex. Für Self-Hosting Llama 4 oder Mistral Large. Wir entscheiden je nach Anforderung.

Können wir das selbst weiterentwickeln nach Übergabe?

Genau das ist das Ziel. Wir liefern dokumentierten Code, Architektur-Diagramme und ein Runbook. Wenn dein Team Python kann, kommt es nach 2–4 Wochen Hand-Holding gut zurecht.

Was ist mit MLOps?

Wir machen MLOps light: Logging, Monitoring (z.B. Langfuse oder Datadog), Cost-Tracking, einfache Tests. Vollständiges MLOps mit A/B-Testing-Plattformen ist meist Overkill für Mittelstand-Projekte.

Wie ist die Datenschutz-Lage bei euch?

Wir unterzeichnen NDAs, arbeiten mit Auftragsverarbeitungsverträgen (AVV), und bei besonders sensiblen Daten kommen wir auf eure Infrastruktur (VPN, Bastion-Hosts). Mehr dazu auf <a href='/recht-ethik/datenschutz'>/recht-ethik/datenschutz</a>.

Können wir Festpreis bekommen?

Bei klar abgegrenzten Workflow-Automatisierungen ja. Bei größeren RAG- oder Voice-Projekten meist T&M-Cap, weil der Umfang während der Discovery-Phase noch konkretisiert wird. Wir geben dir vor Vertragsabschluss eine Range mit Best/Worst Case.

Wer übernimmt nach Go-Live den Betrieb?

Standardmäßig dein Team (mit Doku und Runbook). Optional bieten wir Wartungs-Retainer an: 4h/Monat 1.200 €, 8h/Monat 2.200 €, 16h/Monat 4.000 €. Damit ist der KI-Stack auch im Krisenfall in 24h reaktiviert.

Master of Contact

Patrick — Senior Social Media & GEO Manager

Patrick ist dein erster Ansprechpartner für KI-Beratung, Workshops und Implementierung. Er hört zu, fragt nach — und sortiert für dich, was wirklich Hebel hat.

30 Min · kostenfrei · unverbindlich

30 Min buchen