

Schutz für den LLM-Richter
LLM-Judges anhand der Antworten eines Zielmodells feindselige Verhaltensweisen und Angriffe erkennen. Aber was, wenn stattdessen der LLM-Judge selbst angegriffen wird? Wir zeigen Lösungen für den Fall und liefern Benchmarks für die Wahl eines LLMs.