Xiaomi no se quiere quedar atrás en la carrera de la IA, y sus nuevos modelos de MiMo lo dejan bien claro
Como sabéis si nos habéis seguido a lo largo de los últimos meses, Xiaomi lleva ya un tiempo coqueteando y metida de lleno en el mundo de los modelos de lenguaje de inteligencia artificial, pero lo interesante es que no está yendo poco a poco, sino dando saltos bastante rápidos entre generaciones. En cuestión de meses ha pasado de propuestas más “contenidas” a soluciones mucho más ambiciosas, primero con MiMo-7B y más adelante con MiMo-V2-Flash, pero es que ahora acaban de lanzar la versión Pro del modelo y tiene una pinta increíble.
Prácticamente todas las grandes tecnológicas están construyendo su propio ecosistema de inteligencia artificial, combinando modelos de texto, voz y capacidades multimodales. Xiaomi no quiere quedarse atrás, y lo está haciendo a su manera: avanzando rápido y, sobre todo, integrando todo directamente en sus propios servicios y herramientas.
Xiaomi refuerza su apuesta por la IA con tres modelos muy distintos
Tal y como os acabamos de comentar, el modelo más completo de los tres es MiMo-V2-Pro, que juega en la liga de los grandes. Xiaomi lo plantea como una herramienta pensada para sistemas autónomos capaces de ejecutar tareas complejas sin depender constantemente del usuario y es que, para que te hagas una idea, hablamos de un modelo con más de 1 TB de parámetros y una ventana de contexto enorme, lo que le permite trabajar con grandes cantidades de información sin perder coherencia por el camino y evitando en gran medida las alucinaciones clásicas en la IA.
En la práctica, esto se traduce en que puede encargarse de procesos largos, organizar flujos de trabajo o planificar acciones a futuro dentro de entornos automatizados. Xiaomi asegura que su rendimiento está cerca de modelos muy avanzados del mercado pero con un coste bastante más bajo al usar su propia API, algo que puede hacer que más desarrolladores se animen a probarlo para integrarlo en aplicaciones o sistemas operativos completos en un futuro.
Por otro lado, contamos con MiMo-V2-Omni, un modelo que cambia completamente el enfoque y se centra en lo multimodal. Aquí la clave es que no se limita al texto, sino que puede entender y combinar audio, imágenes y vídeo en una misma tarea, algo que le permite analizar situaciones más complejas como conversaciones con varias personas o contenido audiovisual completo, ampliando bastante los posibles usos más allá de lo típico que ofrece la variante Pro.
Y por último, el tercer modelo, MiMo-V2-TTS, está orientado a la generación de voz. Y no solo a nivel básico, sino con bastante control sobre cómo suena: puedes ajustar el tono, la emoción o el estilo según lo que necesites. Xiaomi incluso habla de usos que van desde conversaciones naturales hasta canto, lo que deja claro que quieren cubrir todo el espectro posible en este apartado que, si bien es muy específico, al menos sabemos que vamos a poder contar con una herramienta bastante potente en este sentido.
Los tres ya están disponibles dentro de la plataforma de Xiaomi y también empiezan a aparecer en herramientas propias como su navegador, MiMo Studio o soluciones de productividad tipo WPS Office. Al final, más allá de cifras o comparativas, lo que realmente destaca es lo rápido que están integrando todo esto en su ecosistema, y es ahí es donde puede estar la clave: no solo crear modelos potentes, sino conseguir que realmente tengan utilidad en diferentes apps y servicios que utilizamos a diario.
Fuente | Xiaomi MiMo
En Mundo Xiaomi | Llevamos años pidiendo un portátil con Windows que esté al nivel de un Mac, y ha tenido que llegar Xiaomi para romper todos los esquemas
Ver todos los comentarios en https://www.mundoxiaomi.com
VER 0 Comentario