ChatGPT es considerado uno de los chatbots de inteligencia artificial (IA) más potentes del mundo, pero solo se podía dar instrucciones o hacerle preguntas a través del texto. Ahora, la nueva versión alcanzó un nuevo nivel: procesar imágenes.
OpenAI anunció que se le podrán enviar imágenes, capturas de pantalla y documentos para obtener respuestas específicas al contexto visual, como identificar objetos o generar descripciones.
Según la compañía, la función de voz está disponible en iOS y Android con opción de suscripción, mientras que la función de imágenes está disponible en todas las plataformas ChatGPT.
OpenAI señala que planea ampliar la disponibilidad de las funciones de imágenes y voz más allá de los usuarios pagos después del lanzamiento escalonado.
TE PUEDE INTERESAR: Así Puedes Usar El Modo StandBy En La Pantalla De Bloqueo En IOS 17
Las nuevas funciones de ChatGPT
- El chat de voz funciona como una conversación auditiva entre el usuario y ChatGPT.
- Para utilizarlo, debes presionar el botón y decir tu pregunta.
- Después de procesar la información, el chatbot te da una respuesta en forma auditiva en lugar de texto.
- El proceso es similar al uso de asistentes virtuales como Alexa o Google Assistant y podría ser el preámbulo de una renovación completa de los asistentes virtuales en su conjunto.
- Para implementar la comunicación de voz y audio con ChatGPT, OpenAI utiliza un nuevo modelo de texto a voz que es capaz de generar ‘audio similar al humano a partir de solo texto y unos segundos de muestra de voz’.
- El modelo Whisper de la compañía puede ‘transcribir sus palabras habladas en texto’.
- La función de imagen te permite capturar una imagen e ingresarla en ChatGPT con tu pregunta o mensaje.
- Puedes utilizar la herramienta de dibujo con la app para ayudar a aclarar tu respuesta y tener una conversación de ida y vuelta con el chatbot hasta que se resuelva el problema.
Foto: FOLOU.