DeepSeek та Xiaomi: ШІ-прорив, що здешевлює інновації на 99%

Зниження цін на китайські ШІ-моделі: революція у доступності

DeepSeek та Xiaomi: ШІ-прорив, що здешевлює інновації на 99% 3

Створіть обліковий запис, щоб зберегти свої статті.Додати в GoogleДодайте Decrypt як джерело за вибором, щоб бачити більше наших історій у Google.

Коротко

  • DeepSeek зробив знижку 75% на V4-Pro постійною 22 травня, встановивши ціну $0.87 за мільйон токенів.
  • Xiaomi знизила ціни на MiMo-V2.5 до 99%, встановивши кешований вхідний потік за $0.0036 за мільйон токенів для Pro-моделі.
  • OpenAI подвоїла ціни на вихідні дані GPT-5.5 до $30 за мільйон токенів при запуску, а Claude Opus 4.7 від Anthropic має новий токенізатор, що може збільшити фактичні витрати до 35%.

DeepSeek зробив 75% знижку на DeepSeek V4-Pro, термін дії якої мав завершитися, постійною цього тижня. А тепер інша китайська ШІ-лабораторія, Xiaomi, різко знизила ціни на API MiMo-V2.5 до 99% для кешованих вхідних даних. Дві найпотужніші ШІ-моделі на ринку стали агресивно дешевшими, тоді як американські лабораторії пішли у протилежному напрямку.

Швидке пояснення для тих, хто не є розробником: коли ви використовуєте ChatGPT або Claude в браузері, ви платите фіксовану абонентську плату — або нічого. Коли компанія створює продукт на основі ШІ-моделі, вона платить за токен, де токен — це приблизно три чверті слова. Кожне надіслане повідомлення, кожна згенерована відповідь, кожен оброблений документ: все це накопичується за ставкою, вимірюваною в мільйонах токенів.

API — це прямий канал, який робить це можливим, дозволяючи додатку, агенту, веб-сайту тощо використовувати модель у власному середовищі. Таким чином, ціна за токен визначає, чи є продукт на основі ШІ економічно вигідним, чи просто “грошовою ямою”.

Пакетні плани токенів — це передплатна обгортка поверх цього. Ви купуєте кредити заздалегідь; модель їх використовує. Оновлення білінгу Xiaomi надає користувачам у 5–8 разів більше токенів за тією ж ціною. План Max за $100 тепер дає 82 мільярди токенів, порівняно з 1.6 мільярда раніше.

Для контексту, 82 мільярди токенів — це понад 60 мільярдів слів.

Чому знижки реальні, а не маркетинговий хід

Фулі Луо, керівник команди MiMo від Xiaomi та колишній ключовий розробник DeepSeek, який брав участь у створенні DeepSeek-V2, опублікував технічне пояснення у X. Найбільша економія досягається завдяки більш ефективному способу зберігання та повторного використання інформації, яку ШІ вже обробив. Замість того, щоб повторювати ту саму роботу, система Xiaomi може запам’ятовувати набагато більше даних одночасно — приблизно вп’ятеро більше, ніж раніше. Це означає, що ШІ потребує значно менше обчислювальної потужності, знижуючи витрати на зберігання та обробку приблизно на 80%.

«Працюючи за цих нових знижених цін API, наш виробничий інференс-двигун працює майже на повну потужність, і ми все ще можемо фактично досягти точки беззбитковості», — написав Луо. «Якщо з’являться нові архітектури, що економлять обчислювальні ресурси та KV-кеш (Key-Value cache), разом із кращою інфраструктурою для зниження витрат API, це сформує чудовий віртуальний цикл в індустрії».

Архітектура DeepSeek досягає того ж результату іншими шляхами. V4 використовує два чергувані типи уваги: один стискає кожні чотири токени для вибіркової уваги, інший — кожні 128 токенів для глобального контексту при мінімальних обчислювальних витратах. При контексті в один мільйон токенів KV-кеш V4-Pro становить 10% від розміру кешу його попередника, а інференс для одного токена працює за 27% попередньої вартості обчислень.

Результатом є модель, яка на 98% дешевша за GPT-5.5 Pro, при конкурентоспроможній продуктивності.

Ставка Кремнієвої долини

Claude Opus 4.7 коштує $5 за мільйон вхідних токенів і $25 за мільйон вихідних токенів. Anthropic зберегла ставку незмінною, але випустила її з новим токенізатором, який може генерувати до 35% більше токенів для однакового вхідного тексту. Отже, ціна не зросла, але ваш рахунок може.

GPT-5.5, випущений наприкінці квітня, просто подвоїв ціну вихідних даних свого попередника до $30 за мільйон токенів. Gemini 2.5 Pro коштує $1.25 за вхідні та $10 за вихідні дані — що є низькою ціною за американськими стандартами.

DeepSeek V4-Pro — це модель з 1.6 трильйона параметрів, яка надає базу знань великої моделі за частку вартості обчислень. Зараз вона працює постійно за $0.435 для вхідних та $0.87 для вихідних даних за мільйон токенів. Це модель, яка показала 80.6% на SWE-Verified проти 80.8% у Claude Opus 4.6 — бенчмарк, що вимірює реальне вирішення проблем GitHub, а не відібрані вручну демонстрації. Різниця в ціні між моделями з практично однаковим показником кодування: 34x за вихідні дані.

MiMo-V2.5-Pro після нових знижок відповідає тій самій ціні $0.435/$0.87 за мільйон токенів. Кешовані запити падають до $0.0036. Для порівняння, це дешевше за токен, ніж більшість людей платять за символ у SMS.

DeepSeek та Xiaomi не самотні

Ці знижки з’явилися на ринку, де китайські моделі вже були значно дешевшими ще до цього. MiniMax M2.7, який конкурує з Claude Opus у бенчмарках кодування за даними Artificial Analysis, коштує $0.30 за вхідні та $1.20 за вихідні дані за мільйон токенів — приблизно 5% від ставки вихідних даних Opus 4.7.

Kimi K2.5 від Moonshot AI, з показником 76.8% на SWE-bench Verified, коштує $0.60 за вхідні та $2.50 за вихідні дані. GLM-5.1 від Z.AI обійшов Claude Opus 4.6 за ключовим бенчмарком кодування на початку цього кварталу. Чотири китайські передові моделі були випущені за 12-денний період на початку травня, всі коштують менше третини вартості токена Opus 4.7.

Для кращої візуалізації, ця діаграма показує, як китайські моделі співвідносяться з трьома найпопулярнішими американськими постачальниками ШІ (Anthropic, OpenAI та Meta) з точки зору співвідношення ціни та якості.

DeepSeek та Xiaomi: ШІ-прорив, що здешевлює інновації на 99% 4

Розрив у другому кварталі 2026 року між китайськими та американськими передовими моделями становить 15–30 разів, залежно від того, які моделі порівнювати — і це базовий показник, до будь-яких знижок на кешування.

Ці тижневі знижки ще більше скорочують цей розрив для конкретних робочих навантажень, які фактично працюють у виробництві: конвеєри агентів зі стабільними системними запитами, процесори документів, інструменти пошуку, речі, які постійно потрапляють у кеш. При вартості $0.003625 за мільйон кешованих вхідних токенів, вартість DeepSeek V4-Pro для повторного контексту фактично стає похибкою округлення.

Погляд Crypto Top: Ці кардинальні зниження цін китайськими ШІ-лабораторіями роблять передові технології машинного навчання значно доступнішими, що може прискорити інтеграцію ШІ-агентів та децентралізованих обчислювальних мереж у Web3. Це також може стимулювати нову хвилю інновацій, де токенізовані обчислювальні потужності та винагороди за дані стануть основою для розробки та розгортання ШІ-моделей.

Джерело: decrypt.co

No votes yet.
Please wait...

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *