LongCat-2.0: Як ШІ-модель непомітно захопила вершину OpenRouter

## Революція ШІ: Meituan представляє LongCat-2.0, змінюючи ландшафт моделей Китайська технологічна компанія Meituan 30 червня офіційно представила LongCat-2.0, потужну модель зі 1.6 трильйона параметрів, що використовує архітектуру “суміш експертів” (Mixture-of-Experts). Ця модель протягом двох місяців діяла анонімно під псевдонімом “Owl Alpha” на платформі OpenRouter, демонструючи вражаючу продуктивність і привабливу ціну, яка значно нижча за аналоги, такі як GPT-5.5 та Claude Sonnet 5.

Технічні характеристики та продуктивність

LongCat-2.0 – це результат значних інженерних зусиль, що дозволили створити модель з надзвичайно великою кількістю параметрів, активуючи при цьому близько 48 мільярдів параметрів на кожен токен. Кількість задіяних параметрів може коливатися від 33 до 56 мільярдів залежно від складності запиту, що забезпечує гнучкість та ефективність обробки даних. За час своєї “таємної” діяльності, модель зайняла провідні позиції в різних рейтингах: перше місце на Hermes Agent, друге на Claude Code та третє на OpenClaw за обсягом викликів. Це свідчить про її високу конкурентоспроможність та затребуваність серед розробників.

Інновації у побудові моделі

LongCat-2.0 вирізняється кількома ключовими інноваціями, що спрямовані на оптимізацію швидкості та функціональності без надмірного збільшення розміру. Система уваги моделі, розроблена на базі DeepSeek, фокусується виключно на найважливіших частинах довгих діалогів, замість рівномірної обробки всього контексту. Це значно прискорює процес генерації відповідей. Додатково, нова система N-грамного вбудовування (N-gram embedding) забезпечує моделі глибше розуміння слів та фраз, створюючи приблизно в 100 разів більше можливих представлень, але не збільшуючи кількість ШІ-компонентів. Це дозволяє моделі сприймати цілі вирази, як-от “Нью-Йорк Сіті”, як єдине поняття, а не сукупність окремих слів. Після тренування, Meituan інтегрувала три спеціалізовані системи: для використання інструментів (Agent), вирішення проблем (Reasoning) та взаємодії (Interaction). Механізм маршрутизації ефективно розподіляє завдання між цими спеціалістами, забезпечуючи оптимальне виконання запитів.

Економічна ефективність та інтеграція

Однією з найвагоміших переваг LongCat-2.0 є її цінова політика. Стандартна ціна за API становить $0.75 за мільйон вхідних токенів та $2.95 за мільйон вихідних токенів, що значно нижче за $5/$30 для GPT-5.5 та $2/$10 для Claude Sonnet 5. Під час запускової акції ціни знижено до $0.30/$1.20. Така економічна ефективність робить LongCat-2.0 надзвичайно привабливою для команд, які займаються розробкою ШІ-агентів, особливо для завдань, що вимагають обробки великих обсягів даних або виконання операцій з високою частотою.

Тестування та застосування

Тестування моделі показало її здатність виконувати складні завдання, хоча й з деякими обмеженнями. У швидкому тестуванні створення гри, модель показала прийнятний результат, але при зростанні складності та кількості ворогів, її логіка ставала менш передбачуваною, що робило гру менш грабельною. Це є типовим для моделей, що фокусуються на буквальному виконанні запитів без глибокого передбачення логічних наслідків. Однак, на бенчмарках, таких як SWE-bench Pro (оцінка вирішення реальних проблем у коді) та FORTE (оцінка ефективності в офісних завданнях), LongCat-2.0 продемонструвала високі результати, випередивши деякі провідні моделі.

Доступність та майбутнє

Модель вже доступна через API-ендпоінти Meituan, сумісні з OpenAI та Anthropic, а також через платформи, що її інтегрують. Однак, для самостійного розміщення (self-hosting) модель поки недоступна, оскільки файли з вагами моделі ще не опубліковані.

Погляд Crypto Top: Інтеграція таких потужних та економічно ефективних ШІ-моделей, як LongCat-2.0, може стимулювати розвиток децентралізованих обчислювальних мереж та ШІ-орієнтованих блокчейн-проектів, потенційно збільшуючи корисність нативних токенів для оплати ШІ-послуг.

Джерело: decrypt.co

No votes yet.

Please wait...

Технічні характеристики та продуктивність

Інновації у побудові моделі

Економічна ефективність та інтеграція

Тестування та застосування

Доступність та майбутнє

Залишити відповідьСкасувати відповідь