FOLOU

Apple Pico-Banana-400K: conjunto de datos que entrena a la IA para editar imágenes

Apple reveló un ambicioso avance en inteligencia artificial (IA) con la publicación de Pico-Banana-400K, un conjunto de datos de 400.000 imágenes reales diseñado para entrenar modelos de IA en edición de imágenes guiada por texto. 

Este proyecto, presentado en octubre de 2025, busca que la IA entienda y ejecute instrucciones de edición de forma más natural, similar a cómo lo haría un humano.

Los investigadores concluyeron que la edición a gran escala es viable si se utilizan imágenes reales y se aplica un filtrado riguroso. Las ediciones de estilo —como cambiar el color o aplicar filtros— fueron las más exitosas. En cambio, mover objetos o modificar texto dentro de las imágenes presentó mayores desafíos técnicos.

El conjunto de datos está disponible para investigación en GitHub, aunque no tiene licencia comercial. Apple lo presenta como un recurso abierto para mejorar la precisión de modelos de IA en edición de imágenes.

TE PUEDE INTERESAR: Samsung presenta su primer teléfono tríptico con pantalla de 10 pulgadas

Qué contiene Pico-Banana-400K

¿Cómo se aplicará en productos Apple?

Foto: Arxiv.

Salir de la versión móvil