Meta випустила Muse Spark: чи зможе він обігнати Gemini 3.1 Pro?

Meta представляє Muse Spark: новий мультимодальний ШІ з фокусом на медицину

Створіть обліковий запис, щоб зберегти свої статті.Додати в GoogleДодайте Decrypt як джерело за вибором, щоб бачити більше наших історій у Google.

Ключові моменти

Meta представляє Muse Spark – закриту, нативно мультимодальну модель ШІ з архітектурою, заснованою на агентах.
Muse Spark демонструє значні успіхи в медичних та пошукових бенчмарках, але поступається Gemini в задачах міркування та кодування.
Розроблена за дев’ять місяців з меншими обчислювальними ресурсами, модель вказує на нову стратегію Meta, орієнтовану на ефективність.

Meta запустила Muse Spark у середу. Це перша модель, розроблена Meta Superintelligence Labs – командою, сформованою дев’ять місяців тому під керівництвом головного директора з ШІ Александрера Ванга після придбання Scale AI за 14 мільярдів доларів. Модель вже доступна на meta.ai та в додатку Meta AI, а протягом наступних тижнів буде інтегрована у Facebook, Instagram та WhatsApp.

Це не просто чергове оновлення чат-бота чи нова версія Llama. Muse Spark є нативно мультимодальною – вона обробляє зображення, текст та голос “з нуля”, а не шляхом додавання візуальних можливостей до існуючої текстової моделі. Вона підтримує візуальні “ланцюжки міркувань” (visual chain-of-thought), використання інструментів та режим, який Meta називає “Режим роздумів” (Contemplating mode). Цей режим запускає кілька ШІ-агентів паралельно для вирішення складних завдань. Це відповідь Meta на розширені режими мислення, представлені в Gemini Deep Think від Google та GPT Pro від OpenAI.

“Muse Spark – це перший крок на нашій масштабованій драбині та перший продукт ґрунтовного перегляду наших зусиль у сфері ШІ,” – зазначено в офіційному анонсі Meta. “Для підтримки подальшого масштабування ми робимо стратегічні інвестиції по всьому стеку – від досліджень і навчання моделей до інфраструктури, включно з дата-центром Hyperion.”

Компанія співпрацювала з понад 1000 лікарями для курації навчальних даних для медичних міркувань Muse Spark. Результати на HealthBench Hard – відкритому бенчмарку для медичних запитів – вражають: Muse Spark набрала 42.8 бала, порівняно з 40.1 для GPT 5.4 та лише 20.6 для Gemini 3.1 Pro. Це не незначна різниця.

У задачах пошуку з використанням агентів (DeepSearchQA) Muse Spark також лідирує з показником 74.8, випереджаючи Gemini (69.7) та GPT 5.4 (73.6). На CharXiv Reasoning – оцінці розуміння даних з наукових статей – модель отримала 86.4, найвищий результат серед усіх порівнюваних моделей.

Для тих, хто цікавиться “зламом” ШІ, модель було зламано за лічені хвилини:

🚰 SYSTEM PROMPT LEAK 🚰

Here’s the full Muse Spark system prompt from Meta!

I noticed @AIatMeta forgot to open source it, so I’ve done them the courtesy 😘

PROMPT:
"""
Who are you?

You are a friendly, intelligent, and agentic AI assistant. You are warm and a bit playful.…

— Pliny the Liberator 🐉󠅫󠄼󠄿󠅆󠄵󠄐󠅀󠄼󠄹󠄾󠅉󠅭 (@elder_plinius) April 8, 2026

Однак, “добрий” не означає “найкращий”. Загальна картина бенчмарків показує, що Gemini 3.1 Pro все ще випереджає Muse Spark у більшості категорій. Розрив найбільш помітний на ARC AGI 2, бенчмарку абстрактного міркування: Gemini набрав 76.5, тоді як Muse Spark – 42.5.

У задачах кодування (LiveCodeBench Pro) показник Gemini 82.9 випереджає результат Meta 80.0. На MMMU Pro – тестуванні мультимодального розуміння – Gemini отримав 83.9 проти 80.4 у Muse Spark. У власному блозі Meta визнає поточні розриви в продуктивності систем з довгостроковим плануванням та робочих процесів кодування.

Meta випустила Muse Spark: чи зможе він обігнати Gemini 3.1 Pro? 4

Також спостерігається помітна стратегічна зміна. Muse Spark – це закрита модель; її архітектура та ваги не будуть опубліковані. Це різкий відхід від Llama, яка побудувала репутацію Meta в колах відкритого ШІ. Після невиразного прийому Llama 4 на початку цього року, Meta, схоже, вирішила, що наступний розділ потрібно писати інакше.

Компанія заявляє, що сподівається відкрити майбутні версії Muse для спільноти, але наразі код залишатиметься внутрішнім. Акції техгіганта зросли майже на 9% у середу після оголошення, завершивши торговий день зростанням на 6.5% до ціни $612.42.

“Режим роздумів” використовує паралельну оркестрацію агентів для підвищення стелі продуктивності моделі. У цій конфігурації Muse Spark досягла 58% на тесті Humanity’s Last Exam та 38% на FrontierScience Research – показники, які роблять її конкурентоспроможною з найпотужнішими версіями Gemini та GPT, а не зі стандартними релізами.

Meta також впроваджує помічника з покупок, який порівнює товари та надає прямі посилання на покупки. Найближчими тижнями планується інтеграція Muse Spark у Facebook, Instagram та WhatsApp, дотримуючись тієї ж стратегії, що й після Llama 3, надаючи доступ понад 3.5 мільярдам користувачів. Відкривається приватний API-прев’ю для обраних розробників.

Модель була розроблена за дев’ять місяців під внутрішньою кодовою назвою Avocado. Meta стверджує, що їхній новий стек попереднього навчання дозволяє досягти такого ж рівня можливостей, як і Llama 4 Maverick, використовуючи більш ніж у 10 разів менше обчислювальних ресурсів.

Muse Spark описується всередині компанії як “маленький і швидкий” перший крок у сімействі Muse. Більш потужна версія вже перебуває в розробці.

Погляд Crypto Top: Інтеграція мультимодального ШІ, подібного до Muse Spark, у соціальні мережі може кардинально змінити спосіб взаємодії користувачів з контентом та брендами, відкриваючи нові можливості для децентралізованих додатків та ШІ-орієнтованих токенів, які зможуть обслуговувати ці зростаючі потреби.

Джерело: decrypt.co

No votes yet.

Please wait...

Meta представляє Muse Spark: новий мультимодальний ШІ з фокусом на медицину

Ключові моменти

Залишити відповідьСкасувати відповідь