El anticipado anuncio de OpenAI trae consigo una innovadora versión de su producto estrella, GPT, llamada GPT-4o. Contrario a los rumores que sugerían un buscador para competir con Google, esta nueva iteración se posiciona como un asistente virtual de vanguardia, con un tono de voz sorprendentemente humano.
Según Altman, el nuevo modo de voz y video de GPT-4o ofrece una experiencia informática sin precedentes, equiparable a la inteligencia artificial representada en películas como “Her”. La capacidad de respuesta, expresividad y naturalidad de esta nueva versión desafía las fronteras entre humanos y máquinas.
GPT-4o, cuyo “o” representa “omni”, marca un paso significativo hacia una interacción persona-computadora más natural y versátil. Esta versión puede procesar texto, audio e imágenes de entrada, generando respuestas igualmente diversificadas. Con un tiempo de respuesta similar al humano y mejoras sustanciales en diversos idiomas, GPT-4o promete un rendimiento excepcional a un costo reducido del 50% en su API.
Sin embargo, el lanzamiento de esta tecnología plantea preocupaciones sobre su posible uso en actividades fraudulentas. La capacidad de GPT-4o para simular conversaciones humanas con precisión exige un enfoque cauteloso para evitar abusos y estafas.
OpenAI ha publicado una serie de demostraciones en YouTube que muestran las capacidades de diálogo de GPT-4o, destacando su habilidad tanto en audio como en video. Aunque el enfoque principal está en la conversación verbal, esta nueva versión también demuestra una mejora significativa en la generación de texto sofisticado.
Con el lanzamiento de GPT-4o, OpenAI establece un nuevo estándar en la interacción persona-computadora, ofreciendo un asistente virtual con habilidades conversacionales equiparables a las de un ser humano. A medida que la IA avanza hacia la sofisticación, surge la necesidad de abordar cuidadosamente los posibles riesgos éticos asociados con su uso.