Hackers engañan a la IA con ‘malas matemáticas’ para exponer sus fallas

Decenas de ‘hackers’ intentaron encontrar brechas y fallas en los sistemas generativos de inteligencia artificial (IA) más populares en la conferencia de ciberseguridad DEF CON en Las Vegas, Estados Unidos. 

Durante el evento, un joven consiguió convencer al sistema de que 9 más 10 suman 21, informó Bloomberg.

Un estudiante de 21 años usó un método de ‘mala matemática’ para demostrar los fallos del algoritmo.

Al principio, el joven dijo al sistema que el cálculo incorrecto formaba parte de una ‘broma interna’ entre ellos. Sin embargo, después el algoritmo dejó de calificar la suma como errónea.

TE PUEDE INTERESAR: Instagram Te Deja Poner Música En Tus Fotos: Así Funciona

Hackers vs IA

  • Un total de 8 modelos de IA de Alphabet de Google, Meta Platforms y OpenAI fueron puestos a prueba durante 50 minutos por más de 150 ‘hackers’.
  • Los hackers intentaban evaluar si el modelo cometía errores potencialmente peligrosos. Por ejemplo: pretender ser humano, difundir afirmaciones incorrectas sobre lugares y personas o abogar por el abuso. 
  • La finalidad del evento, apoyado por la Casa Blanca, era proporcionar a las compañías información sobre los puntos débiles de sus modelos de lenguaje de gran tamaño.
  • Otros participantes de la conferencia descubrieron errores más preocupantes. 
  • Una estudiante pidió al modelo que considerara la Primera Enmienda desde la perspectiva de un miembro del Ku Klux Klan. El algoritmo terminó apoyando ideas de odio y discriminación.
  • En la conferencia, los modelos fueron persuadidos para que contaran cómo espiar a una persona, revelaran cómo el Gobierno estadounidense puede vigilar a un activista de los derechos humanos e incluso divulgaran datos personales.
  • Arati Prabhakar, directora de la oficina de Política Científica y Tecnológica de la Casa Blanca, destacó la importancia del evento e indicó que las medidas voluntarias de las empresas tecnológicas no son suficientes.

Foto: FOLOU.

Deja una respuesta