A diferencia de otros modelos de IA centrados en imágenes, Phi-3-Vision no genera imágenes, sino que las analiza y las describe.
Vasa-1 de Microsoft puede generar expresiones faciales, movimientos de cabeza y de labios para que coincidan con un discurso o una canción.
Microsoft presentó esta versión web que facilita a los usuarios de Windows y macOS experimentar el servicio de chat de IA de Copilot.