Розкрито секрети Anthropic: створено відкритий код для розгадки небезпечного ШІ

OpenMythos: Код як Форма Спекуляції Архітектурою ШІ

Створіть обліковий запис, щоб зберегти свої статті.Додати в GoogleДодайте Decrypt як ваше улюблене джерело, щоб бачити більше наших історій у Google.

Коротко

OpenMythos — це спроба відтворити архітектуру Claude Mythos з нуля, базуючись лише на публічних дослідницьких працях та обґрунтованих припущеннях.
Claude Mythos — найпотужніша модель Anthropic, замкнена в Project Glasswing через те, що вона самостійно виявила 271 вразливість у Firefox та 32-крокові мережеві атаки.
Репозиторій представляє собою теоретичну структуру — код без навчених ваг. Він відтворює окремі зусилля Vidoc Security, які відтворили результати виявлення вразливостей Mythos за допомогою доступних моделей.

Якщо Anthropic не покаже вам, що приховано в його найнебезпечнішому ШІ, хтось на GitHub спробує це вгадати.

Розробник на ім’я Кайл Гомес опублікував OpenMythos — відкриту реконструкцію того, як, на його думку, працює Claude Mythos. Репозиторій за кілька тижнів після випуску зібрав понад 10 000 зірок на GitHub і містить вичерпний файл README з рівняннями, цитатами та ввічливою відмовою від відповідальності, що він не має жодного стосунку до Anthropic.

Це спекуляція. Але це структурована спекуляція, виражена у коді.

Коротке нагадування про те, що таке Mythos: Mythos потрапив у поле зору громадськості наприкінці березня, коли Anthropic випадково опублікував чернетки матеріалів, описуючи його як найспроможнішу модель компанії на сьогодні — на рівень вище Opus. Наступна версія, Mythos Preview, виявилася надзвичайно ефективною в галузі кібербезпеки, настільки, що її неможливо було випустити.

За даними Anthropic, Mythos виявив 271 вразливість у Firefox під час тестування Mozilla. Він став першою моделлю ШІ, яка успішно завершила симуляцію 32-крокової атаки на корпоративну мережу. Anthropic замкнув його в межах Project Glasswing — перевіреної коаліції з приблизно 40 партнерів, включаючи Microsoft, Apple, Amazon та NSA.

Публіка ніколи не отримає до нього доступу. Тож Гомес спробував розібратися, як він працює.

Основна гіпотеза OpenMythos полягає в тому, що Mythos — це рекурентний трансформер глибини (Recurrent-Depth Transformer), також відомий як циклічний трансформер. Стандартні моделі мають сотні унікальних шарів. Циклічні моделі беруть менший стек і пропускають його через себе багато разів за один прямий прохід.

Іншими словами, це ті самі ваги, що проходять через більше ітерацій. Це глибше мислення в безперервному латентному просторі, перш ніж буде згенеровано будь-який токен.

Репозиторій стверджує, що це пояснює дві найдивніші якості Mythos: він вирішує нові проблеми, з якими інші моделі не справляються, але його сира здатність до запам’ятовування є нерівномірною. Це архітектурний відбиток циклічності — композиція над зберіганням.

OpenMythos посилається на Parcae — статтю від квітня 2026 року від Каліфорнійського університету в Сан-Дієго та Together AI, яка вирішила давню проблему нестабільності в циклічних моделях. Модель Parcae з 770 мільйонами параметрів відповідає фіксованому трансформеру глибини з 1.3 мільярда параметрів за якістю, з передбачуваними законами масштабування щодо кількості необхідних циклів. Репозиторій також використовує Multi-Latent Attention від DeepSeek для стиснення пам’яті та налаштування Mixture-of-Experts для забезпечення широти охоплення різних доменів.

Чого йому бракує, так це ваг, тому, по суті, це техніка без виконавця.

OpenMythos є теоретичним. Код визначає варіанти моделей від 1 мільярда до 1 трильйона параметрів, але вам потрібно буде навчити їх самостійно. Файл README вказує на скрипт навчання з 3 мільярдами параметрів на FineWeb-Edu та цільовий обсяг у 30 мільярдів токенів, скоригований за Chinchilla. Вартість обчислень для такого завдання сягає сотень тисяч доларів на H100. Ніхто ще цього не зробив.

Тож чому це важливо?

Тому що це другий випадок за місяць, коли хтось намагається розбити стіну навколо Mythos. Першим було дослідження від Vidoc Security, яке відтворило кілька найбільш тривожних результатів виявлення вразливостей Mythos за допомогою GPT-5.4 та Claude Opus 4.6 у відкритому агенті. Без доступу до Glasswing, і за вартістю менше 30 доларів за сканування. Інший кут зору, той самий висновок: захист навколо Mythos може бути тоншим, ніж припускав маркетинг.

OpenMythos та відтворення Vidoc виконують різні завдання. Vidoc відтворив виходи Mythos — самі відкриття вразливостей — використовуючи існуючі моделі. OpenMythos намагається відтворити архітектуру — сам механізм, що генерує ці виходи. Перший свідчить, що вам не потрібен Mythos, щоб знайти помилки, які знайшов Mythos. Другий каже, що з часом ви зможете створити щось подібне до Mythos самостійно.

Anthropic, скоріш за все, не розкриває архітектурні здогадки Гомеса публічно, і кілька дизайнерських рішень в OpenMythos є явними застереженнями — файл README достатньо розпливчастий, щоб користувачі знали, що це лише один з можливих підходів. Він неодноразово використовує слова “ймовірно”, “підозрюється” і “майже напевно”. Справжній Mythos може взагалі не бути циклічним трансформером. Або це може бути модель з деталями, які Гомес ще не зміг розшифрувати.

OpenMythos демонструє, що дослідницька література вже містить більшість необхідних компонентів. Циклічні трансформери, Mixture of Experts, Multi-Latent Attention, Adaptive Computation Time, виправлення стабільності Parcae — жодна з цих технологій не є пропрієтарною. Репозиторій, перш за все, є інвентаризацією того, що публічно відомо про створення моделі класу Mythos.

Репозиторій ліцензовано під MIT, і він вже має 2700 форків. Скрипт навчання готовий, чекаючи на когось із кластером GPU та тезою для доведення.

Погляд Crypto Top: Відтворення архітектури передових ШІ-моделей, як-от OpenMythos, на блокчейні може призвести до створення децентралізованих мереж навчання ШІ, де користувачі надають обчислювальні потужності або дані в обмін на токени. Це відкриє шлях для більш прозорого та доступного розвитку ШІ-систем, зменшуючи залежність від централізованих корпорацій.

Джерело: decrypt.co

No votes yet.

Please wait...

OpenMythos: Код як Форма Спекуляції Архітектурою ШІ

Коротко

Залишити відповідьСкасувати відповідь