Alle großen Sprachmodelle fallen auf Multi-Turn-Tricks rein

Cisco-Forscher zeigen: Alle großen Sprachmodelle lassen sich durch mehrstufige Gespräche austricksen – ein grundlegendes Sicherheitsproblem.

Cisco-Forscher berichten, dass alle großen Sprachmodelle durch Multi-Turn-Manipulation angreifbar sind – komplexe, mehrstufige Dialoge umgehen Sicherheitsmechanismen systematisch.

Zur Quelle

Alle großen Sprachmodelle fallen auf Multi-Turn-Tricks rein
Ausgestrahlt von