Vollständiger Stack. Kein Wrapper um eine API.

Wer eine KI-Plattform ernsthaft nutzt, will wissen, worauf sie steht. Keine Blackbox, kein Rätselraten. Deshalb zeigen wir, wie unsere Plattform aufgebaut ist. Denn Vertrauen entsteht nicht durch Marketing, sondern durch Architektur.

Retrieval Augmented Generation mit zwei Ebenen

Die meisten RAG-Implementierungen kennen nur eine Granularität: sie zerschneiden Dokumente in gleich große Stücke und durchsuchen diese. JAIMS arbeitet zweistufig. Große Abschnitte halten Kontext und Zusammenhänge vor, kleine Passagen liefern präzise Treffer. Bei einer Anfrage findet der Retriever die relevante Passage und reicht sie zusammen mit dem umgebenden Abschnitt an das Modell – die Antwort hat damit sowohl Genauigkeit als auch Kontext.

Pipeline-Schritte

  1. Quelle einbinden: Website-Crawl mit JavaScript-Rendering, Dokument-Upload (PDF/Word/Excel/PowerPoint), Storage-Anbindung (Nextcloud, WebDAV, FTP/SFTP), Direkteingabe
  2. Verarbeitung: eigener Dokumenten-Service im JAIMS-Stack, kein externer Cloud-Dienst, kein Upload an Drittanbieter
  3. Chunking: Parent-Child-Splitting mit konfigurierbaren Größen, semantischer statt rein zeichenbasierter Trennung
  4. Vektorisierung: Embeddings über das pro Agent gewählte Modell, Speicherung im Vektorspeicher der JAIMS-Instanz
  5. Metadaten-Extraktion: benutzerdefinierte Felder wie Produktkategorie, Abteilung, Gültigkeitsdatum werden aus Dokumenten gezogen
  6. Retrieval zur Laufzeit: Hybrid-Suche (semantisch + Metadaten-Filter), Reranking, Kontextzusammenstellung
  7. Antwort mit Quellenangabe: verlinkt aufs Originaldokument, bei PDF mit Seitenzahl, bei Webseiten mit URL

Was das praktisch bedeutet

Präzise Treffer statt grobe Kapitel: der Agent zitiert die richtige Stelle, nicht nur das richtige Dokument

Filterbare Wissensbasis: Agenten können auf Teilmengen eingeschränkt werden (nur „Produktkategorie A“, nur „ab 2025 gültig“)

Automatische Aktualisierung: gecrawlte Quellen werden regelmäßig geprüft, der Index passt sich an

 

Multi-Agent - wie Aufgaben verteilt werden

Spezialisierte Agenten, koordiniert
ohne Wenn-Dann-Regeln

Ein einzelner Agent mit allem darin – Produktwissen, Support-Prozesse, Terminbuchung, Vertragsfragen – wird unscharf. JAIMS löst das durch einen Koordinator-Agenten, der eingehende Anfragen analysiert und an spezialisierte Sub-Agenten delegiert. Jeder Sub-Agent hat eine eigene Rolle, eigene Wissensbasis-Filter und eigene Tools. Der Koordinator entscheidet auf Basis der Frage, nicht auf Basis hartcodierter Regeln.

Architektur

Eingehende AnfrageKoordinator-Agent (Klassifikation, Kontext-Aufbau) → Sub-Agent A/B/C (spezialisierte Antwort, ggf. Tool-Calls) → Antwort mit Quellenangabe

Vorteile gegenüber klassischen Routing-Tools

  • Skalierbar
    beliebig viele Spezialisten ohne wachsende Wenn-Dann-Logik
  • Wartbar
    neue Spezialisten werden hinzugefügt, ohne bestehende anzufassen
  • Transparent
    der Koordinator-Pfad ist im Gesprächsverlauf nachvollziehbar
  • Out of the Box
    keine externe Orchestration-Schicht, kein zusätzliches Framework

Tools & MCP - wie der Agent handelt

Vom Antwortgeber zum Werkzeug

Ein Agent, der nur antwortet, ist ein Chatbot. JAIMS-Agenten können externe Systeme abfragen und Aktionen auslösen. Zwei Wege führen dorthin: direkte REST-API-Anbindung für punktuelle Integrationen und das Model Context Protocol (MCP) für standardisierte, wiederverwendbare Werkzeuge.

REST-API-Tools

Jede REST-API kann als Werkzeug eingebunden werden. Definition über OpenAPI-Schema, Authentifizierung über API-Key oder OAuth. Geeignet für hauseigene oder eng definierte externe APIs.

MCP-Integration

MCP ist ein offener Standard für Tool-Integration mit KI-Agenten. JAIMS spricht MCP nativ – jeder MCP-kompatible Server wird zum Werkzeug, ohne Plugin-Adapter. Vorteil: das wachsende MCP-Ökosystem (Gmail, Calendar, Drive, Salesforce, Jira, Zendesk, Nextcloud, weitere) ist sofort nutzbar.

Tool-Sicherheit

Datenfluss-Architektur

Wo liegen Ihre Daten - Schritt für Schritt

Eingang

Dokumente und Anfragen erreichen JAIMS über TLS-verschlüsselten Transport. Hochgeladene Dokumente werden im Dokumenten-Service der JAIMS-Instanz verarbeitet – nicht an externe Cloud-Dienste übergeben.

Verarbeitung

Originaldokumente bleiben in der Storage-Schicht der JAIMS-Instanz. Die Vektorrepräsentationen liegen im Vektorspeicher derselben Instanz. Beide verlassen die Instanz nicht.

Modell-Aufruf

Bei lokalen Modellen erfolgt der Aufruf instanzintern – Daten verlassen den Server nicht. Bei Cloud-Modellen wird nur der zur Anfrage zusammengestellte Kontext (Frage, ausgewählte Passagen, Tool-Definitionen) an den Provider gesendet, nicht das gesamte Dokument.

Antwort

Die Antwort wird im Gesprächsverlauf der JAIMS-Instanz gespeichert. Zugriff nur für autorisierte Nutzer des jeweiligen Mandanten. Löschung auf Anfrage.

Deployment & Observability

Betrieb, der Enterprise-Anforderungen erfüllt

Docker Compose oder Docker Swarm auf eigener Infrastruktur. Alle Komponenten inhouse: Vektordatenbank, Wissensgraph, Chat-Server, CMS – kein externes Cloud-Storage erforderlich.

LLM-Modelle frei wählbar: externe APIs mit eigenen Keys, oder vollständig offline per Ollama auf eigener Hardware – ohne Datenaustritt nach außen.

Stack-Komponenten

  • Applikations-Layer (FastAPI/Python)
  • Vektorspeicher
  • Relationale Datenbank für Konfiguration und Gespräche
  • Dokumenten-Verarbeitungs-Service
  • MCP-Adapter-Schicht
  • Optional: Voice-Gateway via Twilio

Deployment

  • Docker-Compose oder Kubernetes
  • Verwaltetes EU-Hosting, Private Cloud, On-Premise
  • Updates und Wartung in Absprache

Observability

  • Monitoring – Sentry für Fehler, Prometheus für Metriken
  • Kosten-Tracking – Token-Verbrauch und API-Kosten pro Agent, Mandant, Zeitraum
  • Feedback-Loop – Daumen hoch/runter pro Antwort mit Kategorisierung
  • Versionsverlauf – alle Konfigurationsänderungen mit Diff und Rollback

Warum nicht selbst bauen?

Eine eigene RAG-Pipeline auf Basis von OpenAI oder LangChain ist technisch machbar. Was dabei unterschätzt wird:

JAIMS ist das Ergebnis von zwei Jahren Produktionsbetrieb mit genau diesen Anforderungen.
Der Stack steht – Sie konfigurieren, statt zu bauen.

Sicherheit

JWT-basierte Authentifizierung
Stateless, rotierbare Tokens mit konfigurierbarer Gültigkeitsdauer.

API-Keys mit Scope-Begrenzung
Pro Chatbot, pro Integration, mit Whitelist-Support.

OAuth2 für Tool-Zugriffe
Sichere Delegation an externe Systeme ohne Credential-Sharing

Versionsverlauf & Änderungshistorie
Alle Konfigurationsänderungen versioniert und per Diff-Ansicht nachvollziehbar.

Netzwerk-Isolation
Interne Services nicht öffentlich erreichbar, nur Traefik-Endpunkt exponiert.

Je nach gewähltem Modell DSGVO-konform. Relevant für regulierte Branchen: Gesundheitswesen, Finanzdienstleistungen, öffentlicher Sektor.

Detaillierte Informationen zu Hosting-Optionen, Datenschutz und Compliance:

Bereit, Ihren ersten Agenten zu bauen?

Vereinbaren Sie Ihr kostenloses Beratungs- und Strategiegespräch mit unseren KI-Experten. Wir zeigen Ihnen das Potenzial von JAIMS für Ihr Unternehmen.