Fei‑Fei Li recauda 1.000 millones para enseñar a la IA a “ver” en 3D

febrero 20, 2026

Fei‑Fei Li recauda 1.000 millones para enseñar a la IA a “ver” en 3D

Resumen de la operación y objetivo de World Labs

Fei‑Fei Li, investigadora conocida informalmente como “la madrina de la IA”, ha cerrado una ronda de financiación por 1.000 millones de dólares para World Labs, la empresa que fundó en 2024 con el objetivo de desarrollar modelos capaces de comprender y generar entornos tridimensionales. Entre los inversores citados están NVIDIA, AMD, Autodesk y el fondo Andreessen Horowitz, entre otros. La noticia amplía el foco de la compañía: pasar de modelos que procesan texto e imágenes bidimensionales a «modelos de mundo» que razonan sobre física, geometría y relaciones espaciales.

Por qué importa: contexto histórico y relevancia tecnológica

El trabajo académico en el que participó Fei‑Fei Li, ImageNet, fue uno de los detonantes que permitieron la expansión del aprendizaje profundo en visión por computador y, por extensión, el desarrollo de muchas aplicaciones de IA generativa que conocemos hoy. Ese precedente explica por qué la comunidad y los inversores prestan atención cuando un equipo con ese bagaje propone abordar lo que consideran el siguiente escollo: la comprensión del espacio físico por parte de las máquinas.

La llamada inteligencia espacial o “world models” busca que una IA no solo identifique objetos en una imagen, sino que entienda dónde están, cómo se mueven, cómo interactúan entre sí y qué sucederá bajo distintas fuerzas o acciones. Ese salto es particularmente relevante para sectores como robótica, videojuegos, efectos visuales, diseño industrial y realidad virtual, donde la correlación entre representación digital y mundo físico es clave.

Tecnología actual de World Labs y su producto Marble

En noviembre de 2025 World Labs lanzó Marble, su primer producto comercial. Marble genera entornos 3D editables y exportables a partir de entradas multimodales: texto, imágenes, vídeos o panoramas. La propuesta es acelerar la creación de contenido 3D —un cuello de botella persistente en videojuegos, VFX y RV— y servir como puente entre flujos de trabajo de diseño y mundos generados por IA.

Con la nueva financiación, World Labs amplía su enfoque hacia la robótica, donde la inteligencia espacial permitiría a robots planificar acciones, simular consecuencias y adaptarse a cambios sin reprogramación puntual. Autodesk ha anunciado un compromiso específico —según los reportes, una aportación de 200 millones— orientado a integrar estos modelos en flujos de trabajo de diseño y producción audiovisual.

Panorama competitivo y comparables

No es un campo aislado. Grandes laboratorios y startups compiten por definir los enfoques dominantes para los modelos de mundo:

  • Google DeepMind trabaja en su familia de modelos Genie, con capacidades para generar y simular entornos 3D.
  • Yann LeCun ha fundado AMI Labs con una propuesta relacionada, defendiendo a veces la necesidad de arquitecturas nuevas fuera del paradigma generativo actual.
  • Startups como Decart y Odyssey también desarrollan soluciones en este espacio, aunque con productos aún orientados a investigación o demos.

Estos movimientos reflejan una tendencia más amplia: la inversión de grandes tecnológicas y fondos en herramientas que conecten la percepción (visión 3D), la simulación física y la generación de activos. En términos comparativos y de mercado, el interés de empresas como Autodesk subraya la convergencia entre herramientas profesionales de diseño y los generadores automáticos de entornos.

Análisis técnico y consideraciones para practicantes

Para equipos técnicos interesados en desarrollar o integrar modelos espaciales, hay varios desafíos y decisiones claves:

  • Representación 3D: elegir entre mallas, vóxeles, campos implícitos (por ejemplo NeRF) u otras estructuras condiciona coste computacional, facilidad de edición y compatibilidad con pipelines existentes.
  • Entrada multimodal y alineación temporal: la combinación de texto, imágenes y vídeo exige técnicas robustas para alinear vistas, calibrar escalas y reconciliar ambigüedades de profundidad.
  • Sim‑to‑real y validación física: para robótica, las simulaciones deben aproximar suficientemente la física real. La transferencia del simulador al mundo real sigue siendo un punto crítico que requiere validación sistemática en hardware.
  • Escalabilidad y coste: entrenar y servir modelos 3D a gran escala tiene requerimientos de memoria y GPU superiores a los modelos puramente textuales o 2D; la optimización y el uso de pipelines mixtos (precomputación, streaming de mallas, LOD) son tácticas habituales.
  • Evaluación: faltan métricas estándar consolidada para juzgar la “comprensión” espacial; las comunidades académicas y de industria deberán definir benchmarks reproducibles que midan razonamiento físico y coherencia geométrica.

“Si la IA ha de ser verdaderamente útil, debe entender mundos, no solo palabras.”

La cita sintetiza la motivación de la apuesta. Desde una perspectiva práctica, convertir esa ambición en sistemas fiables implica trabajo interdisciplinar: visión, gráficos por ordenador, física, robótica y experiencia de usuario.

Riesgos, implicaciones y recomendaciones accionables

El avance hacia modelos espaciales plantea oportunidades claras, pero también riesgos y desafíos regulatorios, éticos y técnicos.

  • Propiedad intelectual y generación de activos: la generación de entornos 3D puede recrear estilos o activos protegidos; las empresas deben auditar orígenes de datos y ofrecer herramientas para gestionar derechos.
  • Seguridad física y pruebas en robótica: permitir que un robot “imagine” acciones requiere barreras de seguridad que impidan comportamientos peligrosos; las pruebas en simulador deben complementarse con protocolos de seguridad en el mundo físico.
  • Privacidad y uso de datos del entorno: entrenar con imágenes o vídeos reales de espacios requiere políticas claras de consentimiento y anonimización cuando proceda.
  • Sesgos y representación: errores en la reconstrucción 3D o simplificaciones pueden introducir sesgos en cómo un sistema percibe entornos reales (por ejemplo, reconocimiento deficiente de estructuras no estándar).

Recomendaciones prácticas para equipos e inversores:

  • Adoptar marcos de evaluación que incluyan pruebas físicas y de seguridad, no solo métricas visuales.
  • Priorizar datasets multimodales y de calidad, con metadatos explícitos sobre origen y restricciones de uso.
  • Diseñar pipelines híbridos que combinen generación automática con revisión humana para contenido sensible o de alto valor comercial.
  • Establecer acuerdos de interoperabilidad (formatos 3D, exportadores/importadores) para facilitar la integración con herramientas profesionales como las de Autodesk.
  • Invertir en documentación y APIs que permitan trazabilidad de los activos generados y control de versiones para uso en producción.

Conclusión

La ronda de 1.000 millones para World Labs refleja la convicción de inversores y actores industriales de que los modelos capaces de razonar en tres dimensiones representan la próxima ola de la IA aplicable al mundo físico. El historial de Fei‑Fei Li y el lanzamiento de Marble muestran un camino comercial temprano, pero la transición de generación 3D a aplicaciones seguras y robustas en robótica y diseño exigirá avances técnicos, métricas comunes y políticas claras sobre derechos y seguridad. Para los practicantes, la recomendación es equilibrar ambición y prudencia: experimentar con pipelines multimodales y simulaciones, pero acompañar despliegues con validación física, auditoría de datos y controles de propiedad intelectual.

Source: www.xataka.com