Apple anunció el lanzamiento de MGIE (MLLM-Guided Image Editing), un nuevo modelo de inteligencia artificial (IA) y código abierto que puede editar imágenes con base en instrucciones de lenguaje natural.
De acuerdo con Apple, el algoritmo trabaja bajo el principio de ‘edición de imágenes guiadas’. El procedimiento aprovecha los beneficios de los modelos de lenguaje grande multimodal (MLLM, por sus siglas en inglés) para interpretar los prompts del usuario y manipular los contenidos a nivel de pixel.
En otras palabras, la herramienta tiene la capacidad de editar fotos en función del texto que escribe el usuario. Por ejemplo, al dar instrucciones como ‘hacer el cielo más azul’, MGIE puede convertirlas en comandos similares a ‘aumentar la saturación de la región del cielo en un 20%’.
TE PUEDE INTERESAR: Google Bard Ahora Ofrece Generación De Imágenes Gratuita
Apple MGIE
- Puede realizar desde ajustes de color simples hasta manipulaciones de objetos complejos, así como ediciones globales y locales.
- Es posible modificar las imágenes al estilo de Photoshop: recortar, cambiar el tamaño, rotar, voltear, agregar filtros, cambiar un fondo, agregar o eliminar objetos y combinar elementos.
- MGIE también puede optimizar la calidad de las imágenes en parámetros como brillo, contraste, nitidez y equilibrio de color, con efectos artísticos adicionales como dibujar, pintar y crear dibujos.
Cómo probar MGIE
- Según el sitio web VentureBeat, Apple lanzó el modelo a través de GitHub, pero los interesados también pueden probar una demostración que actualmente está alojada en Hugging Face Spaces.
- Apple aún no ha dicho si planea usar lo que aprenda de este proyecto en una herramienta o una función que pueda incorporar en cualquiera de sus productos.
- El desarrollo es el resultado de una investigación realizada en colaboración con la Universidad de California en Santa Bárbara.
Foto: Apple / FOLOU.