GPT-5.5-Cyber очолює лідерборд CyberGym, тоді як найкращі моделі Anthropic перебувають офлайн через заборону експорту адміністрації Трампа.
Створіть обліковий запис, щоб зберегти свої статті.Додати в GoogleДодайте Decrypt як джерело за вашим вибором, щоб бачити більше наших історій у Google.
Коротко
OpenAI випустила GPT-5.5-Cyber, модель, розроблену для швидшого виявлення та виправлення вразливостей програмного забезпечення порівняно з попередніми версіями.
Вона перевершує Mythos від Anthropic за ключовими показниками, тоді як Mythos стикається з забороною уряду США через проблеми національної безпеки.
Модель випускається для перевірених захисників з контролем, на відміну від більш обмеженого підходу Anthropic.
Модель для кібербезпеки від OpenAI GPT-5.5-Cyber щойно обійшла модель штучного інтелекту Mythos від Anthropic, яку уряд США відключив — і вона все ще працює.
22 червня OpenAI оголосила про повний запуск GPT-5.5-Cyber в рамках своєї програми кіберзахисту Daybreak. На CyberGym — бенчмарку, розробленому в Каліфорнійському університеті в Берклі, який представляє ШІ-агентам 1507 відомих вразливостей програмного забезпечення з 188 проєктів з відкритим вихідним кодом та оцінює їх за кількістю відтворених у контрольованому середовищі — оновлена модель досягла 85,6%.
Mythos 5 від Anthropic займає 83,8% у тому ж рейтингу. Claude Opus 4.7, більш загальнодоступна модель Anthropic, отримала 73,1%.
Різниця менш ніж у два пункти на будь-якому показнику зазвичай була б незначною. Однак контекст тут є вирішальним. Mythos 5 та Fable 5 від Anthropic були відключені 12 червня після того, як адміністрація Дональда Трампа видала директиву про екстрений контроль експорту, посилаючись на національну безпеку.
Уряд посилався на “джейлбрейк” — техніку обходу вбудованих обмежень безпеки моделі ШІ, подібно до знаходження майстер-ключа, який відмикає високозахищені двері. Anthropic не мав надійного способу перевірки громадянства користувачів у масштабі, тому вимкнув обидві моделі для всіх і всюди.
Частина шкоди була завдана власними діями. Anthropic місяцями описував Mythos як одну з найпотужніших і найнебезпечніших моделей ШІ, попереджаючи у своїй власній документації про випуск, що її можливості в галузі кібербезпеки можуть завдати серйозної шкоди без належних обмежень. Генеральний директор Anthropic Даріо Амодеї опублікував 10 червня есе, порівнюючи передові моделі ШІ з літаками, які регулятори безпеки повинні мати можливість приземлити, якщо вони не пройдуть аудит.
Через кілька днів уряд “приземлив” літаки Anthropic.
Це був не єдиний тривожний сигнал того тижня. Anthropic вже зазнав критики через прихований фільтр у Fable 5, який мовчки погіршував вихідні дані моделі для користувачів, яких він підозрював у створенні конкурентного ШІ — не повідомляючи їх про це — і компанію змусили вибачитися та скасувати цю політику.
Інший підхід
Поки Anthropic веде переговори з Міністерством торгівлі та продовжує судовий позов проти адміністрації Трампа, OpenAI розширює свою присутність. Daybreak уклала партнерські угоди у сфері кібербезпеки з Австралією, Канадою, Францією, Німеччиною, Японією, Південною Кореєю та інституціями ЄС, включаючи Агентство Європейського Союзу з питань кібербезпеки.
Двадцять вісім компаній з безпеки — включаючи CrowdStrike, Cisco та Cloudflare — приєдналися до її програми Cyber Partner Program для інтеграції GPT-5.5 у свої продукти для перевірених клієнтів. Згідно з власним блогом OpenAI, інструмент Codex Security з моменту запуску в березні просканував понад 30 мільйонів комітів у 30 000 кодових баз і зафіксував понад 500 000 виправлених вразливостей.
Компанія також розширює партнерську програму, щоб компанії з безпеки могли інтегрувати ці можливості у свої власні інструменти, і запустила ініціативу “Patch the Planet” для допомоги у виправленні вразливостей у широко використовуваних проєктах з відкритим вихідним кодом.
Варто зазначити, що GPT-5.5-Cyber не призначений для загального використання. Він доступний лише для перевірених фахівців з безпеки, і OpenAI провела попередні тести з федеральними агентствами — включаючи Центр стандартів та інновацій ШІ та Офіс національного кібердиректора — перед запуском. Це той самий підхід обмеженого доступу, який намагався застосувати Anthropic з Mythos, але OpenAI спочатку узгодила свій підхід з урядом.
Станом на 23 червня Fable 5 та Mythos 5 залишаються офлайн — одинадцять днів відсторонення без офіційної дати відновлення від Anthropic чи Міністерства торгівлі.
Погляд Crypto Top: Розвиток спеціалізованих ШІ-моделей для кібербезпеки, як GPT-5.5-Cyber, може стимулювати появу нових децентралізованих рішень для безпеки в Web3, де смарт-контракти та ШІ-агенти працюватимуть разом для захисту мереж. Це також може підвищити попит на токени, що забезпечують обчислювальні потужності для таких моделей, як FET або TAO, підкреслюючи їхню роль у новій ері безпеки.