OpenAI está transformando la interacción de su chatbot mediante la introducción de voz casi humana para ChatGPT.
Esta interesante actualización, que se lanzará para los usuarios premium en las próximas dos semanas, permite a los usuarios entablar diálogos vocales con el famoso chatbot, ofreciendo así una experiencia de conversación inquietantemente humana.
La innovadora función de ChatGPT se basa en un innovador modelo de conversión de texto en voz.
Ofrece a los usuarios la posibilidad de elegir entre cinco voces únicas, llamadas Juniper, Sky, Cove, Ember y Breeze. Todas ellas creadas meticulosamente en colaboración con locutores profesionales.
Joanna Stern, de The Wall Street Journal, que probó la función, encontró las voces "inquietantemente humanas", destacando sus características suaves y sensibles que superan la torpeza esporádica de los asistentes de los teléfonos inteligentes.
Los retos de la voz humana de ChatGPT
Sin embargo, OpenAI también reconoció los peligros potenciales de la tecnología de voz sintética, que puede crear voces creíbles a partir de unos pocos segundos de habla humana.
Estas tecnologías podrían aprovecharse para que “actores maliciosos se hagan pasar por figuras públicas o cometan fraude”, advirtió la empresa.
La incorporación de funciones de voz a ChatGPT, que debutó en noviembre del año pasado, marca un avance significativo en el competitivo sector de las herramientas de IA.
Esta progresión rivaliza directamente con gigantes tecnológicos como Apple y Amazon, cuyos asistentes Siri y Alexa compiten ahora contra un adversario más parecido a un ser humano.
Esta mejora de la tecnología de chatbot subraya los continuos esfuerzos del sector por convertir las herramientas de IA generativa en asistentes personales versátiles.
Inflection AI, un adversario de OpenAI, promociona su chatbot Pi como una "IA personal, diseñada para apoyarte, ser inteligente y estar siempre a tu lado". Este chatbot también incluye una función de voz, lo que subraya el giro de la industria hacia capacidades de interacción similares a las humanas.
Las actualizaciones de ChatGPT
OpenAI ha ampliado aún más la funcionalidad de ChatGPT integrando una función de reconocimiento de imágenes.
Esta función permite a los usuarios presentar imágenes, lo que da lugar a interacciones más dinámicas. Por ejemplo, los usuarios pueden mostrar a ChatGPT el contenido de su frigorífico para ayudarles a planificar las comidas.
"La voz y la imagen ofrecen más posibilidades de utilizar ChatGPT en el día a día", afirmó OpenAI. Esto podría implicar tomar una foto de un punto de referencia durante un viaje e iniciar una conversación en directo sobre su significado, introduciendo una nueva dimensión en la interacción usuario-chatbot.