Pronto podrás crear videos con ChatGPT
El mundo de la inteligencia artificial se prepara para una transformación sin precedentes con el lanzamiento de GPT-5, el próximo gran modelo de lenguaje desarrollado por OpenAI.
Sam Altman quien dirige la empresa, indica que este nuevo avance revolucionará la forma en que las empresas interactúan con la IA. Además explicó que el modelo experimentará un «funcionamiento más sólido», brindando resultados más confiables y una mayor capacidad de personalización.
Una de las innovaciones más destacadas anunciadas por Altman es la futura incorporación de funcionalidades de creación de video en ChatGPT, programada para ocurrir en un plazo de uno a dos años. La revelación se hizo durante una entrevista en el podcast Unconfuse Me de Bill Gates.
Esta integración de video en ChatGPT cambiará la manear en que interactuamos con la IA, permitiendo a los usuarios generar contenido de video a partir de descripciones textuales.
Esto aprovechará la combinación de texto, imágenes, audio y video, abriendo nuevas posibilidades creativas. Aunque los detalles específicos aún no se han detallado, se especula que seguirá patrones similares a las capacidades de creación de imágenes de DALL-E.
La llegada del video en ChatGPT puede ser el paso hacia una nueva era en la creación de contenido digital, pero al mismo tiempo destaca la importancia de la verificación de fuentes y el consumo de información.
Read More
ChatGPT ahora puede ver, oír y hablar
OpenAI, la empresa creadora del chatbot con inteligencia artificial (IA) generativa ChatGPT, anunció una nueva versión de su popular herramienta que es capaz de “ver, oír y hablar” en voz alta con los usuarios.
Hasta ahora solo se podía interactuar con las distintas versiones de ChatGPT por escrito, pero los usuarios de pago en dos semanas podrán tener una conversación en voz alta y escuchar las respuestas de la máquina, así como mandar fotos, imágenes, capturas de pantalla y documentos al chat para obtener respuestas específicas.
Por su parte, los que usan la versión gratuita de esta herramienta podrán sacarle partido a estas nuevas actualizaciones “poco después”, según OpenAI.
“La voz y la imagen te brindan más formas de usar ChatGPT en tu vida. Cuando estés en casa, saca fotografías de tu refrigerador y despensa para saber qué hay para cenar (y haz preguntas para obtener una receta paso a paso)”, anota la empresa en un comunicado.
Mientras que para ejemplificar cómo se puede usar la herramienta de voz, la empresa dice que se puede utilizar para “contar un cuento o resolver un debate”.
Por ahora, este asistente de voz -que es similar a Alexa, de Amazon, y a Siri, de Apple,- estará disponible para iOS y Android, pero no en PC.
Se podrán elegir entre cinco voces distintas, aunque la voz que viene por defecto y la que salía en los ejemplos de hoy es una voz que imita a la de una mujer joven y aparentemente blanca, como suele ser habitual en este tipo de herramientas.
Mediante Whisper -herramienta de OpenAI que usa la IA para trascribir audio- se convierte la voz del usuario a texto, y la compañía luego usa su nuevo modelo de conversión de texto a voz para la respuesta de la máquina.
“Nuestra nueva tecnología de voz es capaz de crear voces sintéticas realistas a partir de tan solo unos segundos de voz real. Esto abre las puertas a muchas aplicaciones creativas y da herramientas de accesibilidad. Sin embargo, estas capacidades también presentan nuevos riesgos, como la posibilidad de que actores maliciosos se hagan pasar por figuras públicas o cometan fraude”, advierte la empresa.
OpenAI, además, anunció hoy que la plataforma de música Spotify está utilizando el “poder de esta tecnología para traducir algunos de sus pódcast a “idiomas adicionales, pero manteniendo las propias voces de los presentadores e invitados”.
Read More