Reranker erklärt — wann sich der zweite Sortierer lohnt
Ein Reranker ist die zweite Sortier-Stufe in deinem Zeptix-Bot. Die erste Stufe sucht schnell viele potenzielle Treffer. Der Reranker schaut sich diese Treffer noch einmal genau an und sortiert sie nach echter Relevanz neu. Das Ergebnis: präzisere Antworten, ohne dass du auf Recall verzichten musst. Aber er kostet Latenz und manchmal Geld.
TL;DR
- Reranker = zweite Sortier-Runde nach der Suche.
- BGE Base ist kostenlos, läuft lokal, gut für Pro-Plan.
- Cohere v3 ist präziser, kostet API-Gebühren, ab Pro-Plan.
- Aktivieren lohnt sich bei größeren Wissensbasen oder kniffligen Fragen.
- Latenz steigt um 150 bis 300 ms pro Antwort.
Was macht ein Reranker eigentlich?
Stell dir vor, du fragst deinen Bot: „Welcher Helm passt für lange Touren?" Der Suche-Knoten findet 16 Snippets, die irgendwie mit Helm und Tour zu tun haben. Das könnten sein:
- Ein Snippet über Helm-Materialien.
- Ein Snippet über Tourenplanung.
- Ein Snippet über Kopfformen für Sporthelme.
- Ein Snippet über Helm-Komfort auf langen Strecken.
Die Reihenfolge dieser Treffer entscheidet, was dein Sprachmodell am Ende formuliert. Der Reranker liest jeden Treffer zusammen mit der Frage und gibt jedem eine echte Relevanz-Note. Plötzlich steht „Helm-Komfort auf langen Strecken" oben — und die Antwort wird viel besser.
Warum die erste Sortierung allein nicht reicht
Die schnelle Vor-Suche basiert auf Vektor-Ähnlichkeit. Sie ist gut darin, thematisch passende Inhalte zu finden, aber nicht gut darin, wer wirklich die beste Antwort ist. Beispiel: Auf die Frage „Was kostet Plan Pro?" findet die Vor-Suche zehn Snippets, in denen es um Pricing geht. Der Reranker erkennt, dass nur drei davon konkret Plan Pro betreffen, und sortiert diese nach oben.
Engines im Vergleich
| Engine | Plan | Latenz | Kosten | Qualität |
|---|---|---|---|---|
| Aus | Alle | 0 ms | 0 € | Basis |
| BGE Base | Pro+ | +150 ms | 0 € (lokal) | Gut |
| Cohere v3 | Pro+ | +250 ms | API-Gebühren | Sehr gut |
BGE Base läuft auf Zeptix-Servern und kostet dich nichts extra. Cohere v3 ist die genauere Option, geht aber an einen externen Anbieter. Beide sind nur ab dem Pro-Plan verfügbar — auf Free und Starter ist nur „Aus" zulässig. Der Visualizer zeigt unzulässige Optionen ausgegraut.
Wann lohnt sich der Reranker?
Reranker an, wenn:
- Deine Wissensbasis hat über 100 Dokumente oder mehr als 500 Snippets.
- Endnutzer fragen oft mit Synonymen oder umgangssprachlich.
- Antworten verwenden manchmal das richtige Thema, aber den falschen Aspekt.
- Du willst Top-K hochziehen (12 oder 16), ohne Präzision zu verlieren.
Reranker aus reicht, wenn:
- Deine Wissensbasis ist klein (unter 50 Dokumente).
- Endnutzer fragen sehr ähnlich wie deine Inhalte formuliert sind.
- Latenz ist kritisch (z.B. Voice-Bots mit Echtzeit-Anspruch).
- Dein Plan unterstützt es nicht (Free, Starter, PAYG).
Wie du den Reranker aktivierst
- Öffne
https://zeptix.dev/visualizerund wähle deinen Bot. - Im Canvas siehst du den Knoten „Auswahl schärfen" — wenn er grau ist, ist der Reranker aus.
- Klicke den Knoten an, der Inspector öffnet rechts.
- Wähle bei Reranker-Engine entweder „BGE Base (lokal)" oder „Cohere v3".
- Lass den Rerank-Pool auf 50 — das passt für die meisten Bots.
- Speichern, dann Live-Vorschau mit drei Test-Fragen.
Der Knoten „Auswahl schärfen" wird dabei sichtbar grün — das ist die visuelle Bestätigung, dass die Stage aktiv ist. Auch der Status-Bar unten zeigt eine erhöhte geschätzte Latenz (von 0.8 s auf etwa 1.0 bis 1.1 s).
Reranker-Pool — was bedeutet die Zahl?
Der Rerank-Pool legt fest, wie viele Initial-Treffer der Reranker neu sortiert. Höher ist nicht automatisch besser:
| Pool | Wirkung |
|---|---|
| 20 | Nur die schon guten Treffer werden umsortiert. Schnell. |
| 50 | Standard. Reranker bekommt genug Auswahl, ohne zu stark zu bremsen. |
| 100 | Sehr breit. Sinnvoll bei diversen Wissensbasen, etwa 50 ms langsamer. |
Bei 90 Prozent aller Bots ist 50 die richtige Wahl.
Häufige Fehler
- Reranker an + Top-K = 4: Bringt fast nichts, weil der Reranker zu wenig Auswahl hat. Top-K mindestens 8.
- Reranker an + Schwelle = 0.70: Nach der Schwelle bleiben nur drei Treffer übrig — der Reranker hat nichts zu sortieren.
- Reranker an, ohne zu testen: Manchmal ist die Reihenfolge schon vorher okay. Vor dem Aktivieren mit der Live-Vorschau zwei bis drei Vergleichsfragen testen.
Für Fortgeschrittene
Wenn du den Reranker mit Multi-Query kombinierst (mehrere Fragevarianten gleichzeitig), bekommst du die beste Pipeline-Qualität — aber auch die höchste Latenz und Cost. Sinnvoll nur für hochwertige B2B-Bots, bei denen Antwortqualität wichtiger ist als Geschwindigkeit.
Nächste Schritte
- Verstehe Präzision oder Recall, bevor du den Reranker einschaltest.
- Optimiere die Wissensbasis selbst — siehe Wissensbasis-Qualität verbessern.
- Wenn du noch tiefer eintauchen willst, schau dir Persona-Tuning an.