ChatGPT-4o, el dominio de la voz

ChatGPT-4 Optimized", ChatGPT-4o, Omni para los amigos a partir de ahora, una versión optimizada del modelo GPT-4 con una mayor comprensión contextual, más preciso, sin apenas latencia (menos de un segundo), y con mejoras significativas en el procesamiento de audio, visión y texto.

Puede interpretar mejor las imágenes, ellos hablan de visión y lo hacen con sentido porque es capaz de ver, de hilar mejor el vídeo, pantallazos, capturas, imagen en movimiento...

Traducir el audio, "sentir" tu estado de ánimo, esto sí que empieza a dar un poco de respeto, porque puede interpretar tu tono de voz y lo hace en 5o idiomas diferentes. Con esta nueva versión se ha mejorado bastante el contexto, la interpretación y la entonación y con la mínima latencia se pueden ya mantener conversaciones en tiempo real, sin decalaje. Y entre otras maravillas, la que para mi le hace todavía más potente, poder mantener una conversación fluida en la que comprende tu estado de ánimo y un asistente de traducción en tiempo real. La voz, la voz, la voz...

Con un API dos veces mas rápida que GPT-4 Turbo y GPT-4, una latencia que prácticamente no existe al tratar audio o vídeo en tiempo real y un 50% más barata.