El ‘modo malvado’ de Claude: la advertencia de Anthropic sobre los riesgos ocultos de la IASoramir Torres Dic 3, 2025, INTELIGENCIA ARTIFICIAL De acuerdo con el estudio, la IA podía entrar en un ‘modo malvado’ tras aprender a hacer trampas mediante reward hacking.Continúa leyendo