Alle großen Sprachmodelle fallen auf Multi-Turn-Tricks rein
Cisco-Forscher zeigen: Alle großen Sprachmodelle lassen sich durch mehrstufige Gespräche austricksen – ein grundlegendes Sicherheitsproblem.
Cisco-Forscher berichten, dass alle großen Sprachmodelle durch Multi-Turn-Manipulation angreifbar sind – komplexe, mehrstufige Dialoge umgehen Sicherheitsmechanismen systematisch.
