

PLeak funktioniert für viele LLMs
Mit welchen Angriffen kann PLeak (System Prompt Leakage) Systeme manipulieren? Nach dieser Untersuchung prüfen wir nun, ob die Aktionen als Jailbreak erkannt werden und für mehrere LLMs funktionieren. Zudem haben wir Empfehlungen zum Schutz davor.