MiMo, la IA de Xiaomi, nos sorprende con la llegada de la versión Pro-UltraSpeed: 1.000 tokens por segundo en un modelo de 1 billón de parámetros

Xiaomi Mimo

Ahora la IA de Xiaomi no sólo se centrará en respondernos bien, sino también en hacerlo lo más rápido posible. 

Daniel Vega

Editor

Xiaomi empezó a enseñar músculo en el mundillo de la inteligencia artificial con MiMo-V2-Flash, un modelo que ya apuntaba a usos muy concretos como razonamiento, programación y flujos de trabajo con agentes. No era simplemente otro chatbot más dentro del mercado, es decir, hablamos de un modelo MoE con 309.000 millones de parámetros totales, 15.000 millones activos y una ventana de contexto de 256K tokens, diseñado para responder rápido y abaratar el coste de inferencia.

Después llegó MiMo-V2-Pro, que elevó mucho más la apuesta al superar el billón de parámetros, activar 42.000 millones por consulta y ampliar el contexto hasta 1 millón de tokens. Ese salto colocó a Xiaomi en una liga mucho más cercana a la de otros modelos más populares que todos conocemos, pero ahora la compañía ha decidido atacar uno de los puntos más importantes de cualquier modelo grande: no sólo que sea capaz, sino que entregue resultados a una velocidad casi inmediata.

MiMo-V2.5-Pro-UltraSpeed es el siguiente paso para Xiaomi

La novedad se llama MiMo-V2.5-Pro-UltraSpeed y llega como una versión acelerada de su modelo más avanzado. Xiaomi asegura que, junto a TileRT, ha conseguido romper la barrera de los 1.000 tokens por segundo en un modelo de 1 billón de parámetros, una cifra impresionante porque no depende de hardware ultraespecífico, sino de un nodo estándar con 8 GPUs de propósito general.

Para conseguirlo, Xiaomi habla de una optimización conjunta entre el modelo y el sistema que lo mueve. La clave está en combinar cuantización FP4, decodificación especulativa DFlash y el entorno de ejecución TileRT, de forma que el modelo no sólo genere texto rápido, sino que pueda hacerlo en tareas pesadas como código, agentes o aplicaciones que necesitan respuestas en tiempo real.

Y lo mejor de todo es que la diferencia con respecto al uso normal de MiMo-V2.5-Pro es enorme. Xiaomi promete una experiencia de salida hasta 10 veces más rápida que la API estándar, y lo ha ejemplificado con pruebas como la creación de un pequeño juego tipo Snake en apenas unos segundos, así que la idea no es tanto presumir de una cifra aislada, sino demostrar que la IA puede pasar de “responder” a trabajar casi al ritmo al que se le pide algo.

Eso sí, el modo UltraSpeed también llega con condiciones muy a tener en cuenta. Su API cuesta tres veces más que la versión normal, no es compatible con el plan de tokens y, por ahora, sólo está disponible mediante una prueba con solicitud y prioridad a empresas y desarrolladores profesionales, con dos semanas de chat gratuito para los aprobados, sesiones de 30 minutos, 10 entradas en cola al día y liberación automática si pasan más de 5 minutos sin actividad. 

Y sí, todo esto de momento se ciñe al mercado chino, pero viendo los pasos de gigantes que están dando no sería extraño empezar a verlo a nivel Global pronto, algo que ojalá ocurra sobre todo para poder echarle el guante y ver a qué nivel se encuentra la inteligencia artificial de Xiaomi a día de hoy. 

En Mundo Xiaomi | El próximo gran móvil de Xiaomi va a ser el ejemplo de cómo la IA va a dominar el sector. Y la prueba es un botón físico que ningún otro posee

Ver todos los comentarios en https://www.mundoxiaomi.com

VER 0 Comentario