Vollständiger Stack. Kein Wrapper um eine API.

Wer eine KI-Plattform ernsthaft nutzt, will wissen, worauf sie steht. Keine Blackbox, kein Rätselraten. Deshalb zeigen wir, wie unsere Plattform aufgebaut ist. Denn Vertrauen entsteht nicht durch Marketing, sondern durch Architektur.

Retrieval Augmented Generation mit zwei Ebenen

Die meisten RAG-Implementierungen kennen nur eine Granularität: sie zerschneiden Dokumente in gleich große Stücke und durchsuchen diese. JAIMS arbeitet zweistufig. Große Abschnitte halten Kontext und Zusammenhänge vor, kleine Passagen liefern präzise Treffer. Bei einer Anfrage findet der Retriever die relevante Passage und reicht sie zusammen mit dem umgebenden Abschnitt an das Modell – die Antwort hat damit sowohl Genauigkeit als auch Kontext.

Pipeline-Schritte

Quelle einbinden: Website-Crawl mit JavaScript-Rendering, Dokument-Upload (PDF/Word/Excel/PowerPoint), Storage-Anbindung (Nextcloud, WebDAV, FTP/SFTP), Direkteingabe
Verarbeitung: eigener Dokumenten-Service im JAIMS-Stack, kein externer Cloud-Dienst, kein Upload an Drittanbieter
Chunking: Parent-Child-Splitting mit konfigurierbaren Größen, semantischer statt rein zeichenbasierter Trennung
Vektorisierung: Embeddings über das pro Agent gewählte Modell, Speicherung im Vektorspeicher der JAIMS-Instanz
Metadaten-Extraktion: benutzerdefinierte Felder wie Produktkategorie, Abteilung, Gültigkeitsdatum werden aus Dokumenten gezogen
Retrieval zur Laufzeit: Hybrid-Suche (semantisch + Metadaten-Filter), Reranking, Kontextzusammenstellung
Antwort mit Quellenangabe: verlinkt aufs Originaldokument, bei PDF mit Seitenzahl, bei Webseiten mit URL

Was das praktisch bedeutet

Präzise Treffer statt grobe Kapitel: der Agent zitiert die richtige Stelle, nicht nur das richtige Dokument

Filterbare Wissensbasis: Agenten können auf Teilmengen eingeschränkt werden (nur „Produktkategorie A“, nur „ab 2025 gültig“)

Automatische Aktualisierung: gecrawlte Quellen werden regelmäßig geprüft, der Index passt sich an

Multi-Agent - wie Aufgaben verteilt werden

Spezialisierte Agenten, koordiniert
ohne Wenn-Dann-Regeln

Ein einzelner Agent mit allem darin – Produktwissen, Support-Prozesse, Terminbuchung, Vertragsfragen – wird unscharf. JAIMS löst das durch einen Koordinator-Agenten, der eingehende Anfragen analysiert und an spezialisierte Sub-Agenten delegiert. Jeder Sub-Agent hat eine eigene Rolle, eigene Wissensbasis-Filter und eigene Tools. Der Koordinator entscheidet auf Basis der Frage, nicht auf Basis hartcodierter Regeln.

Architektur

Eingehende Anfrage → Koordinator-Agent (Klassifikation, Kontext-Aufbau) → Sub-Agent A/B/C (spezialisierte Antwort, ggf. Tool-Calls) → Antwort mit Quellenangabe

Vorteile gegenüber klassischen Routing-Tools

Skalierbar
beliebig viele Spezialisten ohne wachsende Wenn-Dann-Logik
Wartbar
neue Spezialisten werden hinzugefügt, ohne bestehende anzufassen
Transparent
der Koordinator-Pfad ist im Gesprächsverlauf nachvollziehbar
Out of the Box
keine externe Orchestration-Schicht, kein zusätzliches Framework

Tools & MCP - wie der Agent handelt

Vom Antwortgeber zum Werkzeug

Ein Agent, der nur antwortet, ist ein Chatbot. JAIMS-Agenten können externe Systeme abfragen und Aktionen auslösen. Zwei Wege führen dorthin: direkte REST-API-Anbindung für punktuelle Integrationen und das Model Context Protocol (MCP) für standardisierte, wiederverwendbare Werkzeuge.

REST-API-Tools

Jede REST-API kann als Werkzeug eingebunden werden. Definition über OpenAPI-Schema, Authentifizierung über API-Key oder OAuth. Geeignet für hauseigene oder eng definierte externe APIs.

MCP-Integration

MCP ist ein offener Standard für Tool-Integration mit KI-Agenten. JAIMS spricht MCP nativ – jeder MCP-kompatible Server wird zum Werkzeug, ohne Plugin-Adapter. Vorteil: das wachsende MCP-Ökosystem (Gmail, Calendar, Drive, Salesforce, Jira, Zendesk, Nextcloud, weitere) ist sofort nutzbar.

Tool-Sicherheit

Granulare Aktivierung pro Agent - nur die Tools, die der Agent wirklich braucht
Scope-basierte Berechtigung - API-Keys auf konkrete Aktionen begrenzbar
Verschlüsselte Speicherung der Zugangsdaten (AES-256)
Audit-Trail - jeder Tool-Call ist im Gesprächsverlauf nachvollziehbar

Datenfluss-Architektur

Wo liegen Ihre Daten - Schritt für Schritt

Eingang

Dokumente und Anfragen erreichen JAIMS über TLS-verschlüsselten Transport. Hochgeladene Dokumente werden im Dokumenten-Service der JAIMS-Instanz verarbeitet – nicht an externe Cloud-Dienste übergeben.

Verarbeitung

Originaldokumente bleiben in der Storage-Schicht der JAIMS-Instanz. Die Vektorrepräsentationen liegen im Vektorspeicher derselben Instanz. Beide verlassen die Instanz nicht.

Modell-Aufruf

Bei lokalen Modellen erfolgt der Aufruf instanzintern – Daten verlassen den Server nicht. Bei Cloud-Modellen wird nur der zur Anfrage zusammengestellte Kontext (Frage, ausgewählte Passagen, Tool-Definitionen) an den Provider gesendet, nicht das gesamte Dokument.

Antwort

Die Antwort wird im Gesprächsverlauf der JAIMS-Instanz gespeichert. Zugriff nur für autorisierte Nutzer des jeweiligen Mandanten. Löschung auf Anfrage.

Deployment & Observability

Betrieb, der Enterprise-Anforderungen erfüllt

Docker Compose oder Docker Swarm auf eigener Infrastruktur. Alle Komponenten inhouse: Vektordatenbank, Wissensgraph, Chat-Server, CMS – kein externes Cloud-Storage erforderlich.

LLM-Modelle frei wählbar: externe APIs mit eigenen Keys, oder vollständig offline per Ollama auf eigener Hardware – ohne Datenaustritt nach außen.

Stack-Komponenten

Applikations-Layer (FastAPI/Python)
Vektorspeicher
Relationale Datenbank für Konfiguration und Gespräche
Dokumenten-Verarbeitungs-Service
MCP-Adapter-Schicht
Optional: Voice-Gateway via Twilio

Deployment

Docker-Compose oder Kubernetes
Verwaltetes EU-Hosting, Private Cloud, On-Premise
Updates und Wartung in Absprache

Observability

Monitoring – Sentry für Fehler, Prometheus für Metriken
Kosten-Tracking – Token-Verbrauch und API-Kosten pro Agent, Mandant, Zeitraum
Feedback-Loop – Daumen hoch/runter pro Antwort mit Kategorisierung
Versionsverlauf – alle Konfigurationsänderungen mit Diff und Rollback

Warum nicht selbst bauen?

Eine eigene RAG-Pipeline auf Basis von OpenAI oder LangChain ist technisch machbar. Was dabei unterschätzt wird:

Vektordatenbank aufsetzen und betreiben
Dokumenten-Pipeline für PDF, DOCX, PowerPoint, Excel, crawlbare Websites
Chunking-Strategie, die bei langen Dokumenten nicht die Struktur verliert
Draft/Live-Workflow damit Änderungen an der Wissensbasis nicht ungeprüft live gehen
Multi-Tenant-Isolation, wenn mehrere Teams oder Kunden dieselbe Instanz nutzen
Monitoring, Feedback-Loop, Kostenübersicht pro Konversation

JAIMS ist das Ergebnis von zwei Jahren Produktionsbetrieb mit genau diesen Anforderungen.
Der Stack steht – Sie konfigurieren, statt zu bauen.

Sicherheit

JWT-basierte Authentifizierung
Stateless, rotierbare Tokens mit konfigurierbarer Gültigkeitsdauer.

API-Keys mit Scope-Begrenzung
Pro Chatbot, pro Integration, mit Whitelist-Support.

OAuth2 für Tool-Zugriffe
Sichere Delegation an externe Systeme ohne Credential-Sharing

Versionsverlauf & Änderungshistorie
Alle Konfigurationsänderungen versioniert und per Diff-Ansicht nachvollziehbar.

Netzwerk-Isolation
Interne Services nicht öffentlich erreichbar, nur Traefik-Endpunkt exponiert.

Je nach gewähltem Modell DSGVO-konform. Relevant für regulierte Branchen: Gesundheitswesen, Finanzdienstleistungen, öffentlicher Sektor.

Detaillierte Informationen zu Hosting-Optionen, Datenschutz und Compliance:

Bereit, Ihren ersten Agenten zu bauen?

Vereinbaren Sie Ihr kostenloses Beratungs- und Strategiegespräch mit unseren KI-Experten. Wir zeigen Ihnen das Potenzial von JAIMS für Ihr Unternehmen.