Odyssey presenta modelo de IA capaz de transmitir mundos 3D interactivos

Odyssey, una startup fundada por los veteranos del vehículo autónomo Oliver Cameron y Jeff Hawke, ha creado un modelo de inteligencia artificial que permite a los usuarios interactuar con video en streaming en tiempo real.
Ahora disponible como una demostración temprana en la web, el modelo renderiza y transmite nuevos fotogramas de video cada 40 milisegundos. Con controles simples, los usuarios pueden navegar dentro de la escena, de forma similar a la exploración de un entorno 3D en un videojuego.
La empresa presenta un sistema de modelo de mundo que predice escenas futuras con precisión realista y generación de video extendida
Según una publicación en el blog de la empresa, el sistema predice escenas futuras basándose en el entorno actual, eventos pasados e interacciones del usuario. Este “modelo de mundo” puede generar visuales realistas, mantener precisión espacial, aprender acciones a partir de grabaciones de video y producir transmisiones de video continuas de cinco minutos o más.
Startups y gigantes tecnológicos compiten por construir modelos de mundo para medios de próxima generación y simulaciones robóticas
Varias startups y grandes empresas tecnológicas —incluidas DeepMind, World Labs de Fei-Fei Li, Microsoft y Decart— están desarrollando activamente modelos de mundo. Estos sistemas son considerados una base para los medios interactivos del futuro, como videojuegos y películas, así como para simulaciones realistas utilizadas en entornos de entrenamiento de robots.
Sin embargo, las reacciones por parte de las industrias creativas han sido mixtas. Una reciente investigación de Wired reveló que algunos estudios de videojuegos, como Activision Blizzard —que ha despedido a un gran número de empleados— están utilizando IA para agilizar la producción y compensar la pérdida de personal. Mientras tanto, un estudio de 2024 encargado por el Animation Guild estimó que la IA podría afectar a más de 100.000 empleos en cine, televisión y animación en EE.UU. en un futuro cercano.
Odyssey, por su parte, enfatiza que su objetivo es colaborar con los creativos, no reemplazarlos.
“El video interactivo abre una nueva frontera para el entretenimiento”, escribe la empresa en una publicación de su blog, “donde las historias pueden generarse y explorarse en tiempo real, sin las limitaciones y altos costos de la producción tradicional de medios. Creemos que, con el tiempo, todo lo que hoy experimentamos como video —entretenimiento, publicidad, educación, capacitación y viajes— se volverá interactivo, impulsado por la tecnología de Odyssey”.
Odyssey admite que su demostración actual todavía está en una etapa temprana, con imperfecciones notables. Los entornos generados por IA a menudo se ven borrosos y distorsionados, y el diseño puede ser inconsistente: moverse en una dirección o girar puede hacer que el paisaje cambie inesperadamente.
A pesar de estas limitaciones, la empresa afirma que las mejoras están llegando rápidamente. Actualmente, el modelo puede transmitir video a hasta 30 fotogramas por segundo, impulsado por clústeres de GPUs Nvidia H100, con costos operativos estimados entre 1 y 2 dólares por hora de usuario.

Odyssey avanza en modelos de mundo con dinámicas realistas, entornos persistentes y aprendizaje de acciones abiertas
Odyssey afirma que está trabajando en modelos de mundo más avanzados que reflejen mejor las dinámicas del mundo real, con una mayor estabilidad temporal y entornos persistentes. “También estamos ampliando el enfoque desde movimientos simples hacia una interacción más amplia con el mundo, entrenando nuestros sistemas para aprender acciones abiertas a partir de videos a gran escala”, señaló la empresa en una publicación en su blog.
A diferencia de muchos otros laboratorios de IA, Odyssey ha desarrollado su propio sistema de cámaras de 360 grados montado en una mochila para capturar entornos del mundo real. La startup cree que este enfoque personalizado de recopilación de datos puede generar modelos de mayor calidad que aquellos entrenados únicamente con conjuntos de datos públicos.
Hasta ahora, Odyssey ha asegurado 27 millones de dólares en financiación de inversores como EQT Ventures, GV y Air Street Capital. Cabe destacar que Ed Catmull —cofundador de Pixar y expresidente de Walt Disney Animation Studios— forma parte de su junta directiva.
En diciembre, la empresa anunció que está desarrollando un software que permitirá a los creadores importar escenas generadas por su IA en herramientas estándar de la industria como Unreal Engine, Blender y Adobe After Effects, permitiendo así su edición y perfeccionamiento manual.
Read the original article on: TechCrunch
Read more: Google Photos Launches New AI-powered Editor
Deja una respuesta