Штучний інтелект Ріо-де-Жанейро перевершив DeepSeek: Чи справді це прорив?

Rio de Janeiro випустив передову модель ШІ, яка, за заявами, перевершила найкращу розробку Alibaba. Потім з’явилася компанія Nex з докаProof.

13 червня бразильська організація IplanRIO випустила модель Rio 3.5 Open 397B, яка була представлена як передова розробка, створена муніципальним урядом, з показниками, що перевершують Qwen 3.7 Plus від Alibaba. Однак невдовзі компанія Nex опублікувала математичний доказ, що модель є простим змішанням їхньої моделі Nex з Qwen у співвідношенні 0.6 до 0.4. IplanRIO згодом оновила документацію, визнала внесок Nex, видалила завищені показники продуктивності та пояснила ситуацію “неправильним завантаженням”.

Штучний інтелект Ріо-де-Жанейро перевершив DeepSeek: Чи справді це прорив? 5

Ключові моменти:

  • IplanRIO випустила Rio 3.5 Open 397B 13 червня, стверджуючи, що це передова модель з показниками, вищими за Qwen 3.7 Plus.
  • AI-компанія Nex надала математичний доказ, що модель є злиттям 0.6 Nex / 0.4 Qwen.
  • IplanRIO оновила документацію, визнала Nex, відкликала заяви про показники та посилалася на “неправильне завантаження”.

У червні 2026 року муніципальне агентство Ріо-де-Жанейро IplanRIO представило свою розробку — модель штучного інтелекту Rio 3.5. З 397 мільярдами параметрів та вільною ліцензією MIT, вона позиціонувалася як передова розробка, створена в країнах Глобального Півдня.

Презентація моделі збіглася з початком чемпіонату світу з футболу, викликавши ажіотаж у соціальних мережах. Проте, незабаром виникли сумніви щодо її оригінальності.

Оригінальна документація описувала Rio 3.5 як розширення моделі Qwen 3.5 397B від Alibaba з додаванням нового шару міркувань SwiReasoning. Вартість розробки була оцінена приблизно в 100 000 доларів США, що значно дешевше за аналоги.

Архітектура моделі використовує принцип Mixture-of-Experts (MoE), що дозволяє активувати лише частину параметрів (близько 17 мільярдів з 397) для обробки кожного токена, що знижує витрати на інференс. Модель підтримує роботу з текстом та зображеннями, багатомовність і розповсюджується за ліцензією MIT.

Технічним ядром Rio 3.5 є SwiReasoning — фреймворк для інференсу без додаткового навчання, який динамічно перемикається між режимами. При високій впевненості модель працює в режимі явних міркувань, а при низькій — у прихованому режимі внутрішніх станів. IplanRIO стверджувала, що модель була спеціально навчена для використання цієї технології, що й відобразилося на її високих показниках.

Штучний інтелект Ріо-де-Жанейро перевершив DeepSeek: Чи справді це прорив? 6

Початкові показники продуктивності були вражаючими. У тесті Terminal-Bench 2.1 (автономне виконання команд терміналу) Rio 3.5 набрала 70.8%, обійшовши Qwen 3.7 Plus (70.3%) та DeepSeek v4 Pro (67.9%). У тесті IMOAnswerBench (математичні олімпіадні задачі) модель показала 89.5% правильності, а в HLE (Humanity’s Last Exam) — 36.5%, випередивши Qwen 3.7 Plus (34.7%).

Заяви про те, що муніципальний уряд перевершив провідні моделі ШІ, швидко поширилися, особливо після публікації мера Ріо-де-Жанейро Едуардо Кавальєре.

З’являється компанія Nex

“Навчена в Ріо” виявилося не зовсім точним твердженням.

Шанхайський альянс з відкритим програмним забезпеченням у сфері ШІ Nex-AGI опублікував заяву, в якій стверджувалося, що Rio 3.5 є, по суті, їхньою моделлю Nex N2 Pro під іншою назвою.

Команда Nex проаналізувала ваги моделі і виявила, що Rio 3.5 є злиттям у співвідношенні приблизно 0.6 до 0.4 між Nex N2 Pro та Qwen 3.5. Вони надали скрипт верифікації та детальний звіт на GitHub.

Докази Nex складалися з двох частин.

По-перше, поведінковий аналіз. Nex видалив системний запит “Ти — Ріо” і поставив моделі 120 запитань щодо ідентичності. Без цього “маскування” модель у 79.2% випадків називала себе “Nex, від Nex-AGI”, і лише 0% — “Ріо”. Модель також детально відтворювала історію компанії Nex, згадуючи “Шанхайський інститут інновацій” та “альянс екосистеми великих моделей”.

По-друге, математичний аналіз. У випадку злиття ваг, параметри нової моделі повинні лежати на прямій лінії між параметрами вихідних моделей. Nex виміряв цю колінеарність по всіх 60 шарах, отримавши значення 0.993. Такий високий показник по всіх шарах виключає випадковість.

Таким чином, модель Rio 3.5 складалася приблизно на 60% з моделі Nex і на 40% з моделі Qwen.

“Кожен тензор ваг у Rio є, з точністю до тисяч стандартних відхилень, тим самим змішанням 0.6/0.4 Nex і Qwen — по всіх 60 шарах і всіх компонентах мережі”, — зазначили в Nex. “Жодного невинного пояснення немає”.

Штучний інтелект Ріо-де-Жанейро перевершив DeepSeek: Чи справді це прорив? 7

Аналіз результатів також показав, що Nex N2 Pro (75.3% на Terminal-Bench 2.1) випереджає Rio 3.5 (70.8%). Аналогічно, на бенчмарку GDPval Nex має вищий рейтинг (1,585 проти 1,533), що узгоджується з припущенням про змішання моделей.

Штучний інтелект Ріо-де-Жанейро перевершив DeepSeek: Чи справді це прорив? 8

Відповідь IplanRIO

IplanRIO оновила документацію моделі на платформі Hugging Face, видаливши таблицю з показниками продуктивності та змінивши інформацію про авторство.

“Модель створена шляхом злиття nex-agi/Nex-N2-Pro та Qwen/Qwen3.5-397B-A17B, з подальшою дистиляцією за алгоритмом On-Policy Distillation з сильнішої моделі”, — йдеться в оновленому описі. “Ми виявили помилку завантаження попередньої версії, коли замість фінальної дистильованої моделі було завантажено базову версію після злиття. Приносимо вибачення за спричинені незручності”.

Інших публічних заяв від IplanRIO не надходило. Nex тепер офіційно визнано автором.

Пояснення про “неправильне завантаження” є ключовим. IplanRIO стверджує, що намір полягав у випуску дистильованої версії, а не сирого злиття. Процес дистиляції за алгоритмом On-Policy Distillation передбачає навчання моделі-студента на виходах сильнішої моделі-вчителя, що є дорожчим, але все ж дешевшим, ніж навчання з нуля. Якщо цей етап був реалізований, це свідчило б про оригінальну роботу.

Однак, згідно з заявою IplanRIO, фактично було завантажено саме злиття без подальшої дистиляції.

Спільнота розділилася в оцінках. Технічний коментатор Рафаель Кінтанілья висловив припущення, що команда могла просто вказати базову архітектуру, оскільки Nex N2 Pro сама побудована на Qwen. Він також зазначив, що модель набула популярності під час матчу чемпіонату світу, “не обов’язково будучи готовою до публічного використання”.

Розробник і AI-блогер Лукас Монтано зазначив, що “злиття двох моделей класу ~400B і подальша дистиляція за правилами не є тривіальним завданням”, визнавши при цьому як технічну, так і комунікаційну помилку.

Дослідник ШІ Дієго Амбросіо висловився менш прихильно. Початковий реліз описував Rio 3.5 як результат “автономного постоброблення та пропрієтарного тонкого налаштування”, що натякало на оригінальні дослідження, а не на злиття.

Законно? Так. Етично? Не зовсім…

Злиття моделей є цілком законним. Nex N2 Pro розповсюджується за ліцензією Apache 2.0, яка дозволяє її використання, модифікацію та розповсюдження за умови зазначення авторства. Qwen 3.5 також має відкриту ліцензію. Юридичних претензій тут бути не може.

Проблема полягала в представленні результату як самостійно розробленої роботи без зазначення всіх вихідних моделей. Спільнота відкритих розробок вже стикалася з подібним. Раніше цього року модель Composer 2 від Cursor було виявлено як збірку на основі Kimi K2.5 від Moonshot без належного зазначення авторства. Реакція була швидкою і негативно вплинула на репутацію.

Побудова на основі існуючих відкритих моделей є нормою. Як раніше повідомляв Decrypt, компіляція та злиття відкритих ваг фактично утворили окрему підкультуру. Норма полягає не в тому, щоб “не будувати на роботі інших”, а в тому, щоб “зазначати, що саме ви використали”.

Цей випадок набув більшого розголосу, ніж типові пропуски в зазначенні авторства, через інституційний рівень. Анонімний розробник, який видає злиття за власну роботу, — це одне. Муніципальний уряд, який використовує це для заяв про суверенітет у сфері ШІ — це зовсім інше. “Це було марнування ресурсів”, — зазначив один з бразильських коментаторів.

Nex не перетворили це на конфлікт. “Ми вдячні, що місто Ріо скористалося нашою роботою для досягнення передових результатів”, — заявила компанія в X. “Але у світі відкритого програмного забезпечення зазначення авторства має значення”.

IplanRIO працює над завантаженням виправленої, дистильованої моделі з повним зазначенням авторства. Коли вона буде опублікована, будуть проведені повторні перевірки, і спільнота дізнається, чи дистиляція справді щось змінила, чи модель все ще значною мірою базується на роботі Nex.

Погляд Crypto Top: Цей інцидент підкреслює зростаючу залежність розробки ШІ від відкритого коду та важливість прозорості у спільноті. У Web3, де довіра та відкритість є ключовими, такі випадки можуть вплинути на інтеграцію ШІ-токенів, таких як FET чи TAO, з інфраструктурою децентралізованих обчислень, вимагаючи чітких механізмів верифікації та авторства.

Джерело: decrypt.co

No votes yet.
Please wait...

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *