Big Tech en la mira por usar videos de YouTube sin permiso para entrenar IA

Soramir Torres

, MUNDO

Algunas de las empresas tecnológicas más grandes del mundo está acusadas de entrenar sus modelos de Inteligencia Artificial (IA) en un conjunto de datos que incluía transcripciones de más de 173.000 videos de YouTube sin permiso, según una nueva investigación de Proof News. 

El conjunto de datos, que fue creado por una empresa sin fines de lucro llamada EleutherAI, contiene transcripciones de videos de YouTube de más de 48.000 canales y fue utilizado por Apple, NVIDIA y Anthropic, entre otras compañías. 

De acuerdo con el informe, los hallazgos de la investigación ponen de relieve una ‘verdad incómoda’ de la IA que muchos analistas y expertos tienen tiempo hablando: la tecnología se basa en gran medida en los datos desviados de creadores sin su consentimiento o compensación.

TE PUEDE INTERESAR: Claude, La Alternativa De ChatGPT, Lanza App Para Android

Las empresas de tecnología entrenan IA sin consideración

  • El conjunto de datos no incluye ningún video o imagen de YouTube.
  • El conjunto de datos denominado YouTube Subtitles contiene transcripciones de videos de canales educativos y de aprendizaje en línea como ‘Khan Academy’, MIT y Harvard. 
  • Los datos contienen transcripciones de video de los creadores más importantes de la plataforma, incluidos Marques Brownlee y MrBeast, así como de grandes editores de noticias como The New York Times, BBC y ABC News. 
  • Los subtítulos de los videos que pertenecen al sitio web Engadget también forman parte del conjunto de datos.
  • «Apple ha obtenido datos para su IA de varias compañías», publicó Brownlee en X
  • Un portavoz de Google le dijo a Bloomberg que los comentarios anteriores hechos por el director ejecutivo de YouTube, Neal Mohan, diciendo que las empresas que usan los datos de YouTube para entrenar modelos de IA violarían los términos y el servicio de la plataforma sigue en pie. 
  • Apple, NVIDIA, Anthropic y EleutherAI no se han pronunciado.
  • Engadget había señalado que a principios de este mes, artistas y fotógrafos criticaron a Apple por no revelar la fuente de los datos de entrenamiento de Apple Intelligence.

Foto: yousafbhutta en Pixabay

Deja una respuesta