Evidence-Modi — wie streng dein Bot Quellen nutzt
Im Knoten „Quellen verankern" entscheidest du, wie streng dein Bot sich an gefundene Wissens-Snippets hält. Drei Modi stehen zur Wahl: Strikt, Ausgewogen und Hilfreich (keine Halluzination). Falsch gewählt, wird der Bot entweder zu zurückhaltend oder zu kreativ. Diese Anleitung hilft dir, den richtigen Modus zu finden.
TL;DR
- Strikt: Nur Aussagen mit klarem Quellenbezug. Häufige „Weiß-ich-nicht"-Antworten.
- Ausgewogen (Standard): Quellen werden bevorzugt, der Bot füllt Lücken aber höflich.
- Hilfreich: Bot antwortet auch ohne perfekte Quellen, sagt aber dazu, was unsicher ist.
- Mindest-Quellen verstärken den jeweiligen Modus.
- Falscher Modus ist eine der häufigsten Halluzinationsquellen.
Was die Modi technisch bedeuten
Wenn dein Bot eine Frage bekommt, sucht er Wissen in deiner Datenbank. Die Treffer landen im Antwort-Prompt — aber wie eng der Bot sich daran hält, steuert der Evidence-Modus.
| Modus | Verhalten |
|---|---|
| Strikt | Jede Aussage muss durch eine Quelle gedeckt sein. Bei Lücken sagt der Bot „Das weiß ich nicht". |
| Ausgewogen | Quellen werden bevorzugt, aber der Bot kann mit Allgemeinwissen ergänzen, wenn es plausibel ist. |
| Hilfreich | Der Bot antwortet immer, sagt aber transparent, wenn er etwas nicht aus Quellen weiß. |
Wann „Strikt" passt
Strikt ist die richtige Wahl, wenn falsche Antworten teurer sind als gar keine Antwort:
- Compliance-Bots — juristische Themen, Datenschutz, Versicherung.
- Medizinische Bots — auch im weiten Sinne, etwa bei Symptom-Fragen.
- Technische Spezifikations-Bots — wo Werte oder Schwellen exakt stimmen müssen.
- B2B-Sales-Bots — wo eine falsche Pricing-Aussage einen Kunden vergrätzt.
In diesen Fällen kombiniere Strikt mit:
- Mindest-Quellen = 2 (mindestens zwei Treffer nötig).
- Mindest-Ähnlichkeit ≥ 0.60 (nur sehr passende Treffer zählen).
- Top-K = 6 oder 8 (kleinerer Pool, klarere Treffer).
Erwarte, dass der Bot bei 20 bis 30 Prozent aller Fragen „Das weiß ich nicht" sagt. Das ist gewollt — er soll lieber schweigen als Falsches behaupten.
Wann „Ausgewogen" passt
Ausgewogen ist der Standard und passt für 80 Prozent aller Bots:
- FAQ-Bots, bei denen Endnutzer eine konkrete Antwort erwarten.
- Produktinformations-Bots mit guter, aber nicht lückenloser Wissensbasis.
- Coaching- und Beratungs-Bots, bei denen menschliche Empathie wichtiger ist als wissenschaftliche Strenge.
In diesem Modus mischt der Bot Quellen-Wissen und Allgemeinwissen — was er weiß, kommt aus Quellen, was er nicht weiß, formuliert er mit Vorsicht. Der Modus wird mit Mindest-Quellen 1 und Schwelle 0.50 typisch betrieben.
Wann „Hilfreich" passt
Hilfreich ist der weichste Modus. Der Bot antwortet immer, weist aber auf Unsicherheiten hin:
- Marketing-Bots und Demo-Bots, wo Konversation wichtiger ist als Genauigkeit.
- Persönlichkeits-Bots mit starker Persona, bei denen Wissen sekundär ist.
- Lore-Wikis und Fan-Bots, wo Erfindungsreichtum erwünscht ist.
Hilfreich-Modus produziert mit Sicherheit Halluzinationen — das ist Teil des Designs. Wer das nicht akzeptieren kann, sollte „Ausgewogen" wählen.
Mindest-Quellen — der Hebel hinter dem Modus
Im Inspector findest du Mindest-Quellen mit den Werten 0, 1, 2, 3:
| Wert | Wirkung |
|---|---|
| 0 | Bot antwortet auch ohne Treffer, gefährlich in „Strikt" |
| 1 | Standard, ein Treffer reicht |
| 2 | Empfohlen für „Strikt", reduziert Halluzinationen deutlich |
| 3 | Sehr restriktiv, nur für Compliance-Bots |
Wenn weniger als die Mindest-Anzahl gefunden wurde, wird der Fallback ausgelöst. Standard-Fallback ist „Ich weiß es nicht" — alternativ „An Mensch weiterleiten" oder „Trotzdem antworten".
Wie du das im Visualizer einstellst
- Öffne den Visualizer und klicke auf den Knoten „Quellen verankern".
- Im Inspector wählst du:
- Evidence-Modus: Strikt | Ausgewogen | Hilfreich
- Mindest-Quellen: 0–3
- Fallback: Antwort wenn nicht genug Treffer
- Speichern.
- Teste mit drei Fragen:
- Eine, deren Antwort eindeutig in deiner Wissensbasis steht.
- Eine, die nur teilweise abgedeckt ist.
- Eine, die gar nicht abgedeckt ist.
Beobachte, ob das Verhalten zum gewählten Modus passt. Im Strikt-Modus sollte die dritte Frage ein „Weiß ich nicht" auslösen. Tut sie das nicht, ist die Wissensbasis zu breit oder die Schwelle zu niedrig.
Häufige Fehler
- Strikt + Mindest-Quellen 0: Widerspruch. Bot soll streng sein, aber ohne Quellen antworten? Mindest-Quellen mindestens 1, besser 2.
- Hilfreich + Mindest-Quellen 3: Auch Widerspruch. Wenn du Hilfreich nutzt, willst du immer eine Antwort — Mindest-Quellen 0 oder 1 setzen.
- Modus-Wechsel ohne Test: Eine umgestellte Pipeline ohne anschließenden Live-Vorschau-Durchlauf wird oft schlechter.
- Strikt für Smalltalk-Bots: Begrüßungen, Dankesfloskeln und Rückfragen sollten den Bot nicht in „Weiß ich nicht" zwingen — kombiniere Strikt mit dem aktivierten Knoten „Smalltalk-Weiche".
Für Fortgeschrittene
Im Strikt-Modus wird der Persona-Stil teilweise überschrieben — der Bot zitiert eher quellengetreu, weniger im Persona-Ton. Wenn deine Persona stark ist, aber Strikt nötig, kompensiere im Persona-Text mit einer Anweisung wie:
Antworte immer im definierten Stil, auch wenn du nur kurz oder mit „Ich weiß es nicht" antwortest.
Nächste Schritte
- Verstehe Präzision vs Recall, um Top-K und Schwelle zur Modus-Wahl passend einzustellen.
- Prüfe deine Antwort-Verhalten und Grenzen — viele Modus-Effekte hängen damit zusammen.
- Wenn der Bot in Strikt zu oft schweigt, hilft auch Trefferquote bei Fragen erhöhen.