La empresa Anthropic, creadora del modelo Claude, ha lanzado una nueva protección llamada Constitutional Classifier, diseñada para bloquear intentos de jailbreak en su IA. Ahora, está retando al público a intentar hackear su sistema y encontrar vulnerabilidades.
¿Cómo funciona el nuevo sistema de seguridad?
✅ Define reglas claras sobre lo que