Xiaomi презентує революційний ШІ MiMo 2.5 Pro: бачить, чує та діє з однією моделлю

Xiaomi розширює можливості мультимодальних ШІ-моделей, інтегруючи аудіо- та відеоінтерпретацію.

Xiaomi презентує революційний ШІ MiMo 2.5 Pro: бачить, чує та діє з однією моделлю 4

Створіть обліковий запис, щоб зберегти статті.Додати в GoogleДодайте Decrypt як бажане джерело, щоб бачити більше наших історій у Google.

Коротко

  • Xiaomi представила MiMo-V2.5 та V2.5-Pro – уніфіковані мультимодальні ШІ-моделі, що обробляють текст, зображення, аудіо та відео.
  • Версія Pro демонструє конкурентоспроможність з передовими моделями за метриками кодування та роботи ШІ-агентів, оптимізуючи при цьому ефективність токенів та вартість.
  • Нові моделі підкреслюють стрімкий розвиток Xiaomi у сфері ШІ, плануючи відкрити доступ до моделей з відкритим кодом та демонструючи агресивну ітерацію після успіху на платформах на кшталт OpenRouter.

Компанія Xiaomi знову вражає світ штучного інтелекту, представивши нове сімейство своїх моделей.

Лише кілька тижнів тому компанія випустила MiMo-V2-Pro – модель з трильйоном параметрів, яка тихо циркулювала на OpenRouter під псевдонімом “Hunter Alpha”, доки Xiaomi не розкрила її справжню ідентичність. Модель миттєво перетворилася з анонімної на передову. Наші тести підтвердили її вражаючі можливості.

Тепер Xiaomi повертається з MiMo-V2.5 та MiMo-V2.5-Pro – сімейством з двох моделей, що додає до попередньої генерації те, чого їй бракувало в одному пакеті: “очі”, “вуха” та здатність обробляти відео. Додатково, компанія планує відкрити доступ до цих моделей з відкритим кодом у найближчому майбутньому.

Версія V2-Pro була орієнтована виключно на текст і код. Мультимодальні можливості існували в її сестринській моделі, MiMo-V2-Omni, але це був окремий продукт з нижчими показниками в бенчмарках. MiMo-V2.5 об’єднує все це в одну модель – швидшу, потужнішу та з вбудованим розумінням зображень, відео та аудіо з самого початку.

Це має значно більше значення, ніж може здатися пересічному користувачеві. Наприклад, тепер ви можете завантажити фотографію вашого холодильника і попросити модель запропонувати рецепти вечері. Завантажити відеоурок і отримати покроковий підсумок. Записати зустріч і отримати список завдань. Все в одному місці, без необхідності використовувати окремі інструменти та моделі з різними ціновими стратегіями.

Xiaomi стверджує, що MiMo-V2.5-Pro представляє “значний стрибок від MiMo-V2-Pro у загальних можливостях ШІ-агентів, складному програмному інжинірингу та задачах з довгою горизонтом”, і тепер вона відповідає передовим моделям, таким як Claude Opus 4.6 та GPT-5.4, за більшістю бенчмарків кодування та агентської роботи. Цифри здебільшого це підтверджують, хоча певні прогалини залишаються помітними у складніших завданнях міркування.

Базова та про версії служать різним цілям. MiMo-V2.5-Pro – це потужний інструмент. Xiaomi заявляє, що він може “автономно виконувати професійні завдання, що включають понад 1000 викликів інструментів, роботу, яка зайняла б у експертів-людей дні”. Це призначено для розробників, що запускають складні, багатоетапні автоматизовані робочі процеси. Швидкість обробки становить 60–80 токенів на секунду, а вартість – $1.00 за вхідні дані / $3.00 за вихідні дані на мільйон токенів.

MiMo-V2.5 – це повсякденна версія. Вона швидша (100–150 токенів на секунду), дешевша ($0.40 за вхідні дані / $2.00 за вихідні дані) і підтримує всі модальності – зображення, аудіо та відео, які пропускаються у Pro-версії. Обидві моделі мають вікно контексту обсягом 1 мільйон токенів, що дозволяє їм обробляти приблизно 750 000 слів в одній розмові.

На бенчмарку SWE-bench Pro, де моделі виправляють реальні помилки в коді стартапів, оцінюючись за відсотком успішних завдань зі 100, MiMo-V2.5-Pro вирішує 57.2% завдань. Це близько до лідерів галузі; середня модель справляється приблизно з 25%. Схожа картина спостерігається на τ3-bench та ClawEval, де вона відстає лише на кілька пунктів від Claude Opus 4.6 та GPT-5.4. Розрив збільшується на тесті Humanity’s Last Exam, який охоплює завдання рівня аспірантури з десятків академічних дисциплін: MiMo набирає 48.0% проти 58.7% у GPT-5.4 – дефіцит у 10 пунктів, який важко ігнорувати.

Де модель справді виділяється, так це ефективність використання токенів. Xiaomi стверджує, що MiMo-V2.5-Pro використовує на 42% менше токенів, ніж Kimi K2.6, при еквівалентних показниках у бенчмарках, а MiMo-V2.5 використовує майже вдвічі менше токенів, ніж Muse Spark, для досягнення подібних результатів. Для тих, хто масштабує використання цих моделей – розробників, що обробляють тисячі запитів щодня – ця різниця означає реальні гроші.

За мультимодальними завданнями показники MiMo-V2.5 свідчать про те, що вона конкурує з GPT/5.4 та Gemini 3.1 Pro, і досить близька до стандартів Opus 4.6.

Xiaomi презентує революційний ШІ MiMo 2.5 Pro: бачить, чує та діє з однією моделлю 5

З грудня 2025 року Xiaomi здійснила три значні випуски моделей: спочатку випустила ефективну MiMo-V2-Flash, потім тріо V2-Pro/Omni/TTS у березні, а тепер – серію V2.5. Компанія зобов’язалася інвестувати щонайменше 8.7 мільярда доларів у ШІ протягом наступних трьох років, про що генеральний директор Лей Цзюнь оголосив наступного дня після запуску V2-Pro – і темп випусків свідчить про те, що бюджет вже активно рухається.

Темп розробок пояснюється контекстом. Згідно з Digital Applied, станом на початок квітня моделі Xiaomi становили приблизно 21% усього трафіку на OpenRouter, демонструючи зростання понад 42% за останні 7 днів. Коли ваша попередня модель стає однією з найконкурентоспроможніших на найбільшій у світі платформі маршрутизації ШІ, ви маєте як ресурси, так і стимул для швидкої ітерації.

Xiaomi презентує революційний ШІ MiMo 2.5 Pro: бачить, чує та діє з однією моделлю 6

Це, ймовірно, сталося завдяки зростанню популярності агентивного ШІ-інструменту Hermes та його домовленостям з Xiaomi, що надавали користувачам безкоштовний доступ до MiMo v2 Pro протягом обмеженого періоду. Цей період вже завершився, але ажіотаж виявився достатнім, щоб вивести Xiaomi на поле конкуренції.

Ті, хто бажає безкоштовно використовувати Hermes, тепер можуть протестувати нову версію Step 3.5 flash з Nous API або скористатися OpenRouter з безкоштовними, але більш обмеженими моделями.

Також було оновлено ціноутворення для пакетів токенів. MiMo-V2.5 працює за ставкою 1x кредиту; MiMo-V2.5-Pro – за 2x. Xiaomi більше не стягує додаткову плату за використання повного контекстного вікна на 1 мільйон токенів, що робить аналіз довгих документів помітно дешевшим. Існуючі користувачі також отримують повне скидання кредитів як бонус за запуск.

Xiaomi повідомляє, що модель доступна в їхньому AI Studio. Ми намагалися отримати доступ одразу після запуску – безуспішно. Однак, вона вже працює через API Xiaomi MiMo, де її використовуватиме більшість розробників.

Компанія вже працює над наступним поколінням, яке обіцяє “глибше мислення, тіснішу інтеграцію інструментів та багатше обґрунтування реального світу”. З такими темпами, якими рухається Xiaomi, оголошення про це, ймовірно, відбудеться раніше, ніж ви очікуєте.

Погляд Crypto Top: Інтеграція Xiaomi мультимодальних можливостей ШІ у їхні моделі, такі як MiMo-V2.5, може революціонізувати взаємодію з децентралізованими додатками, дозволяючи складніші запити та автоматизацію процесів. Це також може стимулювати розробку нових децентралізованих ШІ-платформ, де ефективність обробки токенів та мультимодальні здібності стануть ключовими факторами успіху.

Джерело: decrypt.co

No votes yet.
Please wait...

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *