El generador de imagen de IA de ChatGPT se retrasa para usuarios gratuitos

OpenAI actualizó ChatGPT con un nuevo generador de imágenes con capacidades mejoradas sobre Dall-E 3 y nativo en el modelo de lenguaje GPT-4o, en lugar de ser otro LLM al que recurre para crearlas. Sin embargo, esta nueva función no llegará todavía a los usuarios gratuitos. 

De acuerdo con el director ejecutivo de OpenAI, Sam Altman, anunció que el lanzamiento de las nuevas funciones virales de imagen de inteligencia artificial (IA) de ChatGPT para los usuarios gratuitos se retrasaría, citando una demanda significativamente mayor de lo que esperaba la compañía.

«Las imágenes en ChatGPT son mucho más populares de lo que esperábamos (y teníamos expectativas bastante altas).  Lamentablemente, el lanzamiento en el nivel gratuito se retrasará por un tiempo», dijo Altman en una publicación en X.

TE PUEDE INTERESAR: Estas son las nuevas medidas la CRC para mejorar la competencia en telefonía móvil

ChatGPT y la generación de imágenes 

  • El martes 25 de marzo, la compañía anunció el lanzamiento de la generación de imágenes nativas de GPT-4o, que permite a los usuarios cargar y modificar imágenes, diciendo que pronto llegaría a todos los niveles de ChatGPT. 
  • A partir del día siguiente, OpenAI solo ha implementado la función para los suscriptores de ChatGPT Pro, Plus y Teams.
  • El nuevo modelo también está disponible en Sora para la creación de imágenes y a través de la herramienta dedicada Dall-E GPT.

Las limitaciones de ChatGPT creando imágenes

No es una limitación realmente, pero el tiempo de procesamiento, dado que crea imágenes más detalladas, puede alargarse hasta un minuto. Las limitaciones que sí ha identificado OpenAI y planea corregir en los próximos meses son:

  • Puede recortar de forma excesiva imágenes largas, como carteles, especialmente en la parte inferior.
  • La generación de imágenes puede inventar información, especialmente usando prompts de bajo contexto.
  • Cuando se generan imágenes basadas en su base de conocimientos, puede tener dificultades para representar más de 10-20 conceptos distintos a la vez, como una tabla periódica completa.
  • A veces presenta problemas al renderizar idiomas no latinos, mostrando caracteres incorrectos o inventados, especialmente en los casos de mayor complejidad.
  • Las solicitudes para editar partes específicas de una imagen, como corregir errores tipográficos, no siempre son efectivas y pueden modificar otras áreas no deseadas o introducir nuevos errores.
  • El modelo tiene dificultades para representar información detallada en tamaños muy pequeños.

Foto: Alexandra_Koch en Pixabay.

Deja una respuesta