Anthropic повертає Claude 3 Opus після зняття експортних обмежень США

Розблокування ШІ: Повернення Claude Fable 5 та Майбутнє Безпеки

Регуляторні зміни та повернення моделі

Адміністрація США скасувала заборону на експорт штучного інтелекту (ШІ) після тижнів переговорів. Компанія Anthropic відновила доступ до своєї моделі Claude Fable 5, приурочивши її повернення до впровадження нового класифікатора безпеки. Це рішення дозволяє моделі знову стати доступною для користувачів по всьому світу з середи, 30 червня, майже через три тижні після того, як директива щодо експортного контролю змусила Anthropic тимчасово вилучити її та споріднену модель Mythos 5 з глобального доступу.

Технічні аспекти безпеки та інновацій

Зупинка роботи моделей була спричинена звітом дослідників Amazon, які виявили метод обходу захисних механізмів Fable 5. Цей метод дозволяв моделі ідентифікувати програмні вразливості, а в одному з випадків навіть генерувати код для їх експлуатації. Оскільки експортні обмеження поширювалися на всіх іноземних громадян незалежно від їхнього місцезнаходження, Anthropic була змушена припинити роботу обох моделей для уникнення порушення нормативних вимог.

Нові засоби захисту та співпраця

У відповідь на ці виклики Anthropic розробила новий класифікатор безпеки. Цей класифікатор, побудований на основі машинного навчання, здатен блокувати виявлену техніку обходу захисту у понад 99% випадків. Усі запити, що будуть позначені цим класифікатором, автоматично перенаправляються до більш потужної моделі Claude Opus 4.8, а користувачі отримують відповідне сповіщення. Дослідники з Центру стандартів та інновацій у галузі ШІ Міністерства торгівлі США високо оцінили ефективність нових та попередніх запобіжних заходів, назвавши їх “надзвичайно сильними”. Водночас, Anthropic визнає, що посилений фільтр може призводити до помилкових спрацьовувань, що зробить Fable 5 ще більш обережною за замовчуванням.

Вплив на конкурентний ландшафт

Тимчасова відсутність Fable 5 та Mythos 5 на ринку надала конкурентам можливість для розвитку. Поки моделі Anthropic були офлайн, OpenAI представила свою модель GPT-5.5-Cyber, яка показала кращі результати на бенчмарку CyberGym, розробленому UC Berkeley. Цей бенчмарк тестує ШІ-агенти на здатність виявляти та відтворювати відомі вразливості у програмному забезпеченні. Китайські компанії також скористалися цією паузою для просування власних систем пошуку вразливостей, таких як Tulong Feng від Qihoo 360 та відкриті альтернативи від Z.ai. Крім того, розумні системи маршрутизації, що використовують менш потужні великі мовні моделі (LLM), продемонстрували результати, порівнянні, а іноді й кращі за показники Mythos 5.

Майбутні перспективи та співпраця

Anthropic активно працює над створенням спільних стандартів для оцінки майбутніх методів обходу захисту. Компанія співпрацює з Amazon, Microsoft та Google над розробкою системи, яка буде оцінювати кожен випадок за такими критеріями, як приріст можливостей, широта застосування, легкість використання для зловмисних цілей та виявлення. Anthropic також зобов’язалася надавати уряду ранній доступ для тестування новітніх моделей ШІ та їхніх засобів захисту до офіційного випуску. Крім того, компанія запустила нову програму на платформі HackerOne, яка дозволяє дослідникам безпосередньо повідомляти про техніки обходу захисту Fable 5.

Погляд Crypto Top: Інтеграція передових технологій ШІ, таких як безпечні класифікатори та ШІ-агенти, з блокчейн-платформами відкриє нові можливості для децентралізованих обчислень та автоматизації за допомогою смарт-контрактів. Це може призвести до появи нових токенів, що представляють обчислювальні потужності або доступ до захищених ШІ-сервісів.

Джерело: decrypt.co

No votes yet.

Please wait...