Wissensbasis, die zep wirklich versteht.
Im Training kommt zusammen, was später beantwortet werden soll. Du verbindest Quellen, prüfst, wie sie zerlegt wurden, und korrigierst direkt im Chat, wenn eine Antwort danebenliegt. Re-Indexing läuft automatisch im Hintergrund — du arbeitest weiter, ohne zu warten.

Drei Schritte, ein klarer Workflow.
Kein Plugin, kein Wizard mit Pflichtfeldern. Du arbeitest in deinem Tempo und springst zwischen den Schritten — alles synct sich automatisch zurück ins Dashboard.
- 1. Quellen
Notion, PDFs, Webseiten, ZIP — alles anschließen.
Verbinde Workspaces per OAuth, lade Datei-Bündel hoch oder gib URLs ein. zep prüft Format, Sprache und Größe und legt einen Indexing-Plan an — du musst keinen Chunker konfigurieren.
- 2. Verifikation
Chunks und Embeddings durchschauen.
Für jede Quelle siehst du die generierten Chunks, ihre Token-Längen und welche Stellen besonders oft als Antwort auftauchen. Pro Chunk gibt es ein Vorschau-Snippet — kein Black-Box-Vector-Store.
- 3. Korrektur
Falsche Antwort? Im Chat richtigstellen.
Wenn der Bot daneben liegt, korrigierst du direkt im Training-Chat. zep markiert die betroffenen Quellen, schlägt eine bessere Quelle vor oder bittet dich um zusätzliches Material — alles ohne Code.

Vier Schritte vom Doc bis zur Antwort.
Wenn du eine neue Quelle hinzufügst, läuft folgende Pipeline an — alles tenant-isoliert und mit Audit-Trail:
- Parsing & Cleaning. Wir entfernen Footer, Cookie-Banner, Navigation und Boilerplate. Bei PDFs erkennen wir Spalten, Tabellen und Code-Blöcke separat. Discord- und Forum-Exporte werden zu Threads gruppiert.
- Chunking & Embeddings. Adaptive Chunk-Größen je nach Inhalt (Code anders als Prosa). Embeddings via aktueller multilingualer Encoder — wir wählen das Modell automatisch nach Sprache und Domain deiner Quelle.
- Re-Ranking. Auf der Antwort-Seite läuft ein zweistufiger Retriever: erst Vektor-Suche, dann ein leichtgewichtiges Re-Ranker-Modell. Das vermeidet, dass nur ähnliche, aber nicht hilfreiche Snippets gefunden werden.
- Source-Verification. Jede Antwort enthält Verweise. Klickst du im Training-Chat auf eine Antwort, springst du zur exakten Stelle der Quelle. Falsche Quellen kannst du blacklisten — zep nutzt sie nie wieder.
Typische Anwendungsfälle, die wir täglich sehen.
Notion-Workspace als FAQ
OAuth verbinden, Datenbanken auswählen — Re-Indexing automatisch bei jeder Änderung. Stell Versand-FAQ um, der Bot weiß sofort Bescheid.
Online-Kurs aus Skripten
PDFs hochladen, Modul-Reihenfolge zep erklären. Lerner fragen, der Bot zitiert mit Modulnummer und Kapitelreferenz.
Coding-Wissen aus eigener Codebase
ZIP der Resources hochladen, zep indexiert Dateien, Funktionen, Patterns. Coding-Bot kennt deinen Stack und antwortet im Diff-Format.
Vereins-Wiki aus Forum + Discord
Forum-Export plus Discord-JSON, Threads werden gruppiert, häufige Fragen automatisch erkannt — neuer Mitglieder-Bot in einer Sitzung fertig.
Multi-Sprachen-Support
Quellen können gemischt sein. zep erkennt die Sprache jeder Antwort und nutzt das passende Embedding-Modell — Service-Bots in DE/EN/FR ohne separate Setups.
Live-Korrektur durch das Team
Mehrere Editor-Rollen können parallel im Training-Chat arbeiten. Korrekturen sind versioniert, du siehst, wer wann was angepasst hat.
FAQ.
Wie schnell ist eine neue Quelle einsatzbereit?
Kleine Texte (unter 50 Seiten) sind in 5–15 Sekunden indexiert. Mittlere Notion-Workspaces mit ein paar hundert Pages brauchen 30–90 Sekunden. Größere PDFs (200+ Seiten) oder ganze Webseiten laufen im Hintergrund weiter — der Bot antwortet in der Zwischenzeit aus dem alten Stand und schaltet automatisch um, sobald die neue Version steht.
Was, wenn der Bot eine falsche Antwort gibt?
Du markierst die Antwort im Training-Chat als falsch. zep zeigt dir die zugrunde liegenden Snippets, du kannst die Quelle blacklisten, neu chunken oder eine bessere Quelle hinzufügen. Korrekturen wirken sofort — kein Re-Upload, kein Re-Index der ganzen Wissensbasis.
Wo liegen meine Embeddings?
Tenant-isoliert in unserem Vektor-Store, gehostet in der EU (Hetzner Falkenstein). Kein Cross-Tenant-Indexing, keine Wiederverwendung deiner Embeddings für andere Bots. Im Pro-Plan kannst du Embeddings auch exportieren und auf eigener Infrastruktur halten.
Welche LLM-Modelle nutzt ihr für die Antwort?
Standardmäßig ein performance-optimiertes Allround-Modell (DACH-Sprachraum). Im Pro-Plan kannst du pro Bot zwischen Reasoning-Modellen, Speed-Modellen und Long-Context-Modellen wählen. Custom-API-Keys sind im Business-Plan möglich.
Wissensbasis bauen, ohne YAML zu schreiben.
Im Free-Plan kannst du das komplette Training-Erlebnis ausprobieren. Drei Quellen, eine Bot-Persona — und du kannst sehen, ob der Workflow zu deinem Material passt.
