El 26 de julio Tencent ha liberado HunyuanWorld 1.0, modelo open‑source capaz de generar escenas 3D interactivos a partir de texto o imágenes (github). Este proyecto, desarrollado por el equipo Hunyuan3D, combina las ventajas de los modelos 2D y 3D para crear escenas inmersivas y explorables, y ofrece compatibilidad completa con los canales de producción de gráficos 3D.
¿Qué es HunyuanWorld 1.0?
HunyuanWorld es un sistema generativo que acepta descripciones escritas o imágenes como entrada y produce mundos tridimensionales, con geografía, texturas y objetos interactivos. Su arquitectura utiliza representaciones de malla 3D jerárquicas y generación panorámica para crear entornos coherentes a 360°. En el contexto de la Web 4.0 es una nueva herramienta que da libertad a los creadores de contenido para enriquecer escenas VR.
Ventajas clave
HunyuanWorld 1.0 sobresale por tres características:
-
Experiencias inmersivas de 360°: genera panoramas completos que sirven de proxy para los mundos 3D y permiten explorar la escena en cualquier dirección.
-
Exportación de mallas: los mundos se pueden exportar como mallas 3D estándar, lo que facilita su integración en motores de juego, programas de modelado o simuladores físicos.
-
Representaciones objeto por objeto: separa la escena en capas semánticas, de modo que los objetos se modelan de forma independiente y se pueden mover, rotar o escalar (3d-models.hunyuan.tencent.com).
Estas innovaciones pueden dar lugar a escenas navegables y coherentes que superan a las alternativas en calidad visual y consistencia geométrica.
Arquitectura y funcionamiento
El núcleo de HunyuanWorld está formado por una arquitectura generativa escalonada. En un primer paso se crea un panorama 360° mediante un modelo de difusión que sintetiza la imagen global. Luego, un sistema de capas semánticas descompone la escena en elementos significativos (cielo, terreno, objetos) y aplica reconstrucción 3D por capas para calcular mapas de profundidad panorámicos y generar una malla optimizada. Esta combinación de panoramas como proxy y reconstrucción jerárquica evita la falta de consistencia y el alto coste computacional de los métodos basados en vídeo.
El modelo es capaz de trabajar con entradas de texto o imágenes, lo que lo hace versátil para múltiples flujos de trabajo. Además, su diseño modular permite adaptar la tecnología a otros generadores de imágenes como Hunyuan Image, Kontext o Stable Diffusion.

Cómo empezar a usar HunyuanWorld
HunyuanWorld 1.0 es completamente open‑source. El código y las instrucciones para instalarlo están disponibles en el repositorio oficial de GitHub, mientras que los pesos preentrenados se pueden descargar desde Hugging Face. Para ponerlo en marcha, los desarrolladores deben clonar el repositorio, crear el entorno con Python 3.10 y PyTorch 2.5.0 y, opcionalmente, instalar bibliotecas adicionales como Real‑ESRGAN y ZIM.
Pasos básicos
-
Clonar el repositorio:
git clone https://github.com/Tencent-Hunyuan/HunyuanWorld-1.0.git. -
Crear el entorno con Conda utilizando el archivo de configuración suministrado.
-
Descargar los modelos desde Hugging Face (por ejemplo, HunyuanWorld‑PanoDiT‑Text para texto→panorama).
-
Ejecutar los scripts de ejemplo (
demo_panogen.pyydemo_scenegen.py) para generar panoramas y escenas 3D.
El repositorio incluye documentación detallada y enlaces a la versión en español del README, así como un informe técnico completo para profundizar en la arquitectura y los algoritmos.
Aplicaciones y futuro
La capacidad de generar mundos 3D explorables a partir de simples descripciones abre posibilidades en numerosos sectores. En realidad virtual (VR) y gaming, los diseñadores podrán crear escenarios mediante frases como “una ciudad futurista al atardecer con rascacielos de cristal”. Para simulaciones físicas y ingeniería, el modelo permite exportar mallas compatibles con motores como Unity o Unreal y realizar colisiones, fluidos o pruebas de iluminación. También será útil en la creación de contenido digital, cine, educación o arquitectura, donde los usuarios podrán iterar rápidamente sobre diseños sin necesidad de modelar a mano.
Tencent afirma que HunyuanWorld es un paso hacia la democratización de la creación 3D y que seguirá evolucionando con nuevas versiones y optimizaciones. Gracias a su licencia comunitaria, investigadores y desarrolladores pueden contribuir al proyecto, adaptarlo a sus necesidades o integrarlo en otras soluciones de IA.
Más información: Informe técnico Hunyuan-Tencent