Wikipedia y la lucha contra los bots de IA: qué significa para la fundación 

La Wikipedia, y su banco de imágenes y videos, Wikimedia Commons, dependen de una fundación sin ánimo de lucro, basada en las donaciones. Sus servidores están sobrecargados por los bots para entrenar a la inteligencia artificial (IA), que se llevan todo el contenido sin ni siquiera dar las gracias.

De acuerdo con la compañía, este aumento repentino en el tráfico de bots podría ralentizar el acceso a las páginas y activos de Wikimedia, especialmente durante eventos de alto interés. Cuando Jimmy Carter murió en diciembre, por ejemplo, el mayor interés de la gente en el video de su debate presidencial con Ronald Reagan provocó tiempos de carga de página lentos para algunos usuarios. 

Wikimedia está equipado para soportar picos de tráfico de lectores humanos durante tales eventos, y los usuarios que ven el video de Carter no deberían haber causado ningún problema. Pero ‘la cantidad de tráfico generado por los bots scraper no tiene precedentes y presenta riesgos y costos crecientes’, dijo Wikimedia.

TE PUEDE INTERESAR: WhatsApp te dejará silenciar el micrófono y apagar la cámara antes de aceptar llamadas

Las acciones de Wikipedia con la IA

  • La fundación explicó que los lectores humanos tienden a buscar temas específicos y, a menudo, similares. Por ejemplo, varias personas buscan en Wikipedia lo mismo cuando está de moda. 
  • Wikimedia crea una caché de un fragmento de contenido solicitado varias veces en el centro de datos más cercano al usuario, lo que le permite servir contenido más rápido. 
  • Los artículos y el contenido al que no se ha accedido en un tiempo tienen que ser servidos desde el centro de datos central, lo que consume más recursos y, por lo tanto, cuesta más dinero para Wikimedia. 
  • Dado que los rastreadores de IA tienden a leer páginas de forma masiva, acceden a páginas oscuras que deben servirse desde el centro de datos central.
  • Wikimedia dijo que, si se mira más de cerca, el 65% del tráfico que consume recursos que recibe proviene de bots. 
  • Ya está causando interrupciones constantes para su equipo de confiabilidad del sitio, que tiene que bloquear a los rastreadores todo el tiempo antes de que ralenticen significativamente el acceso a la página a los lectores reales. 
  • El verdadero problema, como afirma Wikimedia, es que la ‘expansión ocurrió en gran medida sin suficiente atribución, lo cual es clave para impulsar a nuevos usuarios a participar en el movimiento’.
  • Una fundación que depende de las donaciones de la gente para seguir funcionando necesita atraer a nuevos usuarios y conseguir que se preocupen por su causa. 
  • «Nuestro contenido es gratuito, pero nuestra infraestructura no lo es», dijo la fundación. 
  • Wikimedia ahora está buscando establecer formas sostenibles para que los desarrolladores y reutilizadores accedan a su contenido en el próximo año fiscal.

Foto: Gerd Altmann en Pixabay.

Deja una respuesta