La presentacióni ncluyó demostraciones de las capacidades del bot de Open AI.

Tecnología

Lanzan el nuevo ChatGPT-4o: cómo acceder a la versión gratis y qué trae de nuevo

14/05/2024 | 15:04

Una de las grandes novedades de esta edición es la posibilidad de utilizar el servicio de forma gratuita, a diferencia de su predecesor (ChatGPT-4), que exige un pago mensual.

Redacción Cadena 3

Octavio Liberali

El CEO de Open AI, Sam Altman, confirmó el lanzamiento de GPT-4o y dijo a través de sus redes sociales que estará disponible en el sitio oficial en las próximas semanas. La nueva versión del modelo permite procesar y crear textos, audios y videos. Además, el director de la empresa anunció un nuevo modo de voz y video.

Desde el primer lanzamiento de ChatGPT en julio de 2018, fueron presentadas seis versiones diferentes del chatbot. Se trata de un sistema de chat basado en el modelo de lenguaje por Inteligencia Artificial.

Según Open AI, la nueva versión representa una transición hacia una interacción persona-computadora mucho más fluida y natural. GPT-4o ("o" de "omni") aceptará como entrada cualquier combinación de texto, audio e imagen, y es capaz de generar cualquier combinación de salidas de texto, audio e imagen a gran velocidad.

Su velocidad de respuesta puede ser de tan solo 232 milisegundos, alcanzando un promedio de 320 milisegundos, tiempo similar a lo que tarda un humano para responder en una conversación normal frente a frente con otra persona.

/Inicio Código Embebido/

/Fin Código Embebido/

"Antes de GPT-4o, podías usar el modo de voz para hablar con ChatGPT con latencias de 2,8 segundos (GPT-3.5) y 5,4 segundos (GPT-4) en promedio. Para lograr esto, Voice Mode es una canalización de tres modelos separados: un modelo simple transcribe audio a texto; GPT-3.5 o GPT-4 toma texto y genera texto, y un tercer modelo simple convierte ese texto nuevamente en audio. Este proceso significa que la principal fuente de inteligencia, GPT-4, pierde mucha información: no puede observar directamente el tono, varios parlantes o ruidos de fondo y no puede emitir risas, cantar ni expresar emociones", explicó Open AI en su web oficial.

Esta nueva versión iguala el rendimiento de GPT-4 Turbo en texto en inglés y código, con una mejora significativa en texto en distintos idiomas, además de inglés. “Nuestro nuevo modelo GPT-4o, es el mejor que hemos hecho. Es inteligente, es rápido, es multimodal nativo", declaró Altman.

Otra de las grandes novedades de esta edición es la posibilidad de utilizar el ChatGPT-4o de forma gratuita, a diferencia de su predecesor (ChatGPT-4, que exige un pago mensual) además de que tendrá una versión de escritorio. "Queremos poner herramientas de IA geniales en las manos de todo el mundo", concluyó Altman.

/Inicio Código Embebido/

/Fin Código Embebido/

Hasta el momento, OpenAI no fijo una fecha de lanzamiento exacta, pero las autoridades aseguraron que el nuevo modelo estará disponible en pocas semanas. No está claro si esa disponibilidad será para todo el mundo en una fecha única de lanzamiento o si será por distintas regiones del planeta.

En el momento en que esté disponible la nueva versión del bot, los usuarios deberán entrar a la página oficial de Open AI e ingresar con el usuario y contraseña habitual. En caso de entrar por primera vez, será necesaria la creación de una cuenta. Una vez confirmado el acceso, el usuario deberá seleccionar la opción "ChatGPT-4o" cuando esté disponible y podrá comenzar a interactuar.

La nueva versión se anunció un día antes del lanzamiento de Gemini, el motor de búsqueda de Google y la herramienta que competirá con ChatGPT. La carrera por ocupar el primer lugar entre distintas plataformas de inteligencia artificial llevó, por ahora, a Microsoft a convertirse en la mayor empresa del mundo por capitalización bursátil, arrebatando el primer puesto a Apple.

Otros avances que incluye ChatGPT-4o son, por ejemplo, las mejoras en el tipeo de información y traducciones en tiempo real, participar de reuniones y crear un resumen de la misma, la posibilidad de cambiar el tono de voz para que el asistente suene más a un humano que a un robot y ayudar a aprender un idioma, entre otras funciones.

/Inicio Código Embebido/

/Fin Código Embebido/


Te puede Interesar

Tecnología

Los servicios técnicos de HP, Lenovo y Acer hablaron con Cadena 3 y brindaron consejos respecto al uso correcto de estos dispositivos para prolongar su vida útil y evitar accidentes.