Anthropic випадково зламала захист: код Claude тепер назавжди в мережі

Витік коду Claude від Anthropic: Технічний аналіз та наслідки

Anthropic випадково зламала захист: код Claude тепер назавжди в мережі 3

Інцидент з витоком коду

Компанія Anthropic, відома розробкою потужних великих мовних моделей (LLM), зіткнулася з серйозним інцидентом безпеки: випадковим витоком значного обсягу вихідного коду свого кодувального ШІ-агента Claude. Інцидент стався через помилку в конфігурації файлу вихідної карти (source map) під час випуску версії Claude Code 2.1.88 до реєстру npm. Файл вихідної карти, який зазвичай використовується для налагодження та має залишатися приватним, був випадково включений до публічного релізу.

Виявивши проблему, команда Anthropic оперативно видалила пакет з npm. Однак, до цього моменту інформація про витік вже поширилася в мережі. Особливо швидко це сталося завдяки повідомленню в соціальній мережі X від дослідника Chaofan Shou, яке швидко набрало мільйони переглядів. В результаті, близько 512 000 рядків коду, що складають значну частину проекту, були заархівовані та поширені на численних платформах.

Представники Anthropic заявили, що витік стосувався виключно внутрішнього вихідного коду і не зачіпав конфіденційні дані клієнтів чи облікові дані. Компанія класифікувала інцидент як помилку пакування релізу, спричинену людським фактором, а не як цілеспрямований злам безпеки. Наразі вживаються заходи для запобігання подібним ситуаціям у майбутньому.

Технічні деталі витоку

Витік надає унікальну можливість зазирнути у внутрішню архітектуру одного з найдосконаліших кодувальних ШІ-агентів на ринку. Серед виявлених компонентів: системи оркестрації LLM API, механізми координації між множинними ШІ-агентами, логіка керування дозволами, процеси OAuth, а також 44 приховані прапорці функцій (feature flags), що вказують на нерелізований функціонал.

Особливий інтерес викликають такі розробки, як Kairos — фоновий демон, що постійно працює, зберігає журнали пам’яті та виконує нічні “сни” для консолідації знань. Також було виявлено Buddy — аналог “тамагочі” на основі ШІ, з 18 видами, рівнями рідкісності та статистиками, що включають налагодження, терпіння, хаос та мудрість. Згідно з наявними даними, планувався попередній випуск цього “Buddy” в період з 1 по 7 квітня.

Ще однією цікавою знахідкою, яка викликала жваві обговорення, є система “Undercover Mode“. Ця підсистема розроблена для запобігання випадковому розкриттю внутрішніх кодових імен та назв проектів Anthropic під час внесків до репозиторіїв відкритого коду. Системний промпт, що впроваджується в контекст Claude, буквально містить інструкцію: “Не розкривай свою справжню сутність” (“Do not blow your cover.”).

Anthropic випадково зламала захист: код Claude тепер назавжди в мережі 4

Реакція спільноти та роль децентралізації

Спроби Anthropic відкликати код за допомогою DMCA-повідомлень виявилися неефективними. Це сталося завдяки швидкій реакції спільноти розробників. Корейський розробник Sigrid Jin, відомий своєю роботою з великими обсягами токенів Claude, оперативно переписав ключову архітектуру з TypeScript на Python, створивши новий репозиторій claw-code. Цей репозиторій надзвичайно швидко набрав десятки тисяч зірок на GitHub, встановивши новий рекорд.

Цей підхід, відомий як “clean-room rewrite” (переписування в чистій кімнаті), створює новий, незалежний твір, який технічно не порушує авторські права на оригінальний код. Це ставить під сумнів ефективність DMCA-запитів у децентралізованому середовищі.

Юридична складність посилюється питанням авторських прав на код, згенерований ШІ. Оскільки існує ймовірність, що значна частина коду Claude була написана самим ШІ, правовий статус будь-яких претензій на авторське право стає ще менш визначеним.

Децентралізація відіграла вирішальну роль у закріпленні доступу до коду. Акаунт @gitlawb скопіював оригінальний код на Gitlawb — децентралізовану платформу для зберігання Git-репозиторіїв, заявивши: “Ніколи не буде видалено”. Це демонструє, що децентралізована інфраструктура, подібна до тієї, що лежить в основі блокчейну, стійка до централізованих спроб видалення контенту.

Крім того, було зібрано та опубліковано всі внутрішні системні промпти Claude. Це надає цінну інформацію для інженерів промптів та дослідників безпеки ШІ, дозволяючи глибше зрозуміти, як Anthropic тренує та контролює свої моделі.

Цей інцидент підкреслює важливість децентралізованих технологій. DMCA-відкликання ефективні проти централізованих платформ, але не проти розподілених систем. Коли компанія намагається видалити інформацію з Інтернету, ключовим фактором стає кількість дзеркал та тип інфраструктури, на якій вони розміщені. У цьому випадку, протягом кількох годин, було створено достатньо дзеркал, щоб зробити відновлення контролю практично неможливим.

Погляд Crypto Top: Цей витік відкриває нові можливості для інтеграції передових ШІ-моделей з децентралізованими обчислювальними мережами, потенційно революціонізуючи токеноміку ШІ-проектів, таких як FET або TAO. Розвиток прозорих, перевірених кодів ШІ-агентів може значно підвищити довіру та утиліту в екосистемі Web3.

Джерело: decrypt.co

No votes yet.
Please wait...

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *