Xiaomi y el paso adelante que acaba de dar para llegar al futuro de la conducción: coches sin conductor con Xiaomi OneVL

El modelo IA acaba de ser hecho 'open source' para que cualquiera pueda trabajar con él

César Otero

Editor

Ver y estar dentro de coches capaz de auto-conducirse es algo que la Ciencia Ficción nos lleva enseñando décadas. Pero desde que Tesla democratizó los coches eléctricos y la asistencia a la conducción, estamos cada vez más cerca de ello. Y Xiaomi quiere no solo ser de las primeras, sino compartirlo con todos.

Y es que Xiaomi ha presentado hoy oficialmente el modelo de conducción autónoma Xiaomi OneVL. Pero también ha hecho algo más: ha publicado en código abierto el modelo, para que cualquier desarrollador acceda a él. 

Xiaomi OneVL, el modelo de conducción autónoma pionero al acceso de todos

Los sistemas IA que Xiaomi está desarrollando ya han logrado que sus coches eléctricos sean más 'inteligentes' que hace dos años. Y tanto los modelos nuevos como los primeros SU7 tendrán una actualización de su sistema operativo en la que irá un sistema de conducción asistida impulsado por el nuevo modelo cognitivo XLA, un gran modelo de lenguaje que Xiaomi integrará de serie en toda la gama

Según explica la propia compañía, este sistema permitirá al coche procesar distintos tipos de información al mismo tiempo y tomar decisiones de una forma más precisa y natural, algo parecido a lo que ya hace el autopilot de Tesla en muchas carreteras del mundo. Pero el XLA ha servido de base para otro modelo IA, uno más potente: el OneVLA

Este modelo es pionero en el sector al unificar múltiples enfoques tecnológicos, como:

  • VLA: Visión-Lenguaje-Acción, sistemas de IA fundamentales que permiten a los robots comprender órdenes e instrucciones humanas en lenguaje natural, interpretar su entorno visualmente y generar acciones físicas en tiempo real
  • World Models: Modelos del mundo, un cambio fundamental en la inteligencia artificial, moviéndose de la simple generación de contenido a la comprensión y simulación del entorno físico tridimensional
  • Razonamiento en el espacio latente: Técnica avanzada de inteligencia artificial donde el modelo realiza inferencias, planificación y resolución de problemas complejos internamente, dentro de sus representaciones vectoriales ocultas (espacio continuo), en lugar de generar texto o pasos intermedios explícitos

Partiendo de la potente capacidad de razonamiento del modelo XLA, el OneVLA mejora considerablemente la velocidad y la precisión del razonamiento, lo que lo convierte en una solución innovadora dentro del sector. En cuanto a precisión, supera al CoT (Cadena de Pensamiento Explícita o Explicit Chain-of-Thought - técnica en inteligencia artificial donde el modelo no solo da una respuesta final, sino que genera y muestra secuencialmente los pasos lógicos que siguió para llegar a ella) explícito. Y en cuanto a velocidad, se equipara a la solución CoT de subespacio con predicción de "solo respuesta".

Un modelo que mezcla tecnologías IA bajo un solo fin: la conducción autónoma

En el pasado, VLA y los World Models eran dos líneas de tecnología relativamente independientes en el campo de la conducción autónoma: 

  • VLA se centraba en comprender el escenario y generar acciones de conducción
  • Los modelos del mundo se centraban en predecir la evolución de los escenarios futuros

Lo que hace Xiaomi OneVL mediante el razonamiento en el espacio latente, es unificar por primera vez ambas en un mismo marco. Según los datos publicados por Xiaomi, en  varios bancos de pruebas principales que abarcan la percepción, el razonamiento y la planificación, Xiaomi OneVL ha superado por completo el límite máximo de rendimiento de los métodos de razonamiento latente:

Al mismo tiempo, Xiaomi OneVL ofrece interpretabilidad en dos dimensiones -lingüística y visual- para la toma de decisiones del modelo: no solo explica con texto "por qué se conduce así", sino que también muestra en imágenes predictivas "qué va a pasar a continuación". De esta forma, los vehículos equipados con esta tecnología 'piensan' mejor lo que está sucediendo alrededor de ellos en pleno tráfico.

Desde luego, el avance de Xiaomi es enorme, y que además ese modelo lo haya ofrecido en código abierto dice muchísimo de sus intenciones, que son que todo el mundo pueda aprovecharse de ello y hacer avanzar entre todos la tecnología de la conducción autónoma. 

Vía | MyDrivers

En Mundo Xiaomi | Los seis niveles de la conducción autónoma. En cual están los coches de Xiaomi ahora mismo

Ver todos los comentarios en https://www.mundoxiaomi.com

VER 0 Comentario