Інтернет обурений: Anthropic випустила Claude 5, і користувачі в люті

Запалювання токенів, мовчазна цензура та обов’язкове збирання даних — наймасштабніший реліз Claude став найскандальнішим для Anthropic.

Інтернет обурений: Anthropic випустила Claude 5, і користувачі в люті 2

Anthropic випустила свою найпотужнішу публічну модель у вівторок, а вже в середу значна частина спільноти штучного інтелекту (ШІ) побажала, щоб цього не сталося. Консенсус щодо Claude Fable 5 — першої публічно доступної версії обмеженої технології компанії класу Mythos — полягає в тому, що вона чудово справляється з програмуванням і дає дивовижні результати в повсякденних сесіях. Однак її випуск супроводжувався низкою серйозних нарікань: вона спалює токени з катастрофічною швидкістю; вона таємно знижує власну продуктивність для певних дослідницьких завдань; і вона змушує всіх користувачів погодитися на 30-денне зберігання даних без винятків. Реакція була негайною та гучною, охопивши дослідників, розробників, засновників компаній та прихильників відкритого програмного забезпечення. Це був не звичайний буркотливий старт. Скоріше, це було схоже на пробудження.

Токенна піч

Перше, що помітили користувачі, не стосувалося безпеки. Fable 5 коштує 10 доларів за мільйон вхідних токенів і 50 доларів за мільйон вихідних токенів — удвічі дорожче, ніж Claude Opus 4.8.

Така ціна сама по собі є агресивною, але справжній біль для користувачів полягає в тому, як модель поводиться в межах тарифних планів. Fable 5 подвоює використання лімітів порівняно з Opus, що означає, що та сама робота на Fable вичерпує ваш план удвічі швидше, перш ніж ви заплатите хоч цент за API. На практиці ситуація погіршилася. У нашому власному швидкому тестуванні Fable вичерпала денну квоту одним запитом. Ситуація не покращується, навіть якщо ви є одним із клієнтів з глибокими кишенями. Bleeping Computer також тестував Fable і виявив, що він вичерпав денну квоту підписки Max за 100 доларів менш ніж за дев’ять хвилин. CEO Scrimba Пер Борген провів розрахунки публічно: “Щойно спробував Fable. Він спалив 1,3 мільйона токенів за 7 хвилин. Це 160 доларів на годину. Еквівалентно зарплаті 333 тисячі доларів на рік”, — написав він у X. Тео з T3 Chat повідомив, що витратив понад 1000 доларів на токени за один день на своєму плані підписки за 200 доларів. Джош Елліторп, технічний директор Pixelated Ink, сказав, що Fable 5 “спалює токени як жодна інша модель”, надаючи йому лише кілька запитів, перш ніж вичерпати квоту. “Навіть не можу це протестувати, оскільки моє тестування таке обмежене”, — обурився він. Відповідь Anthropic полягає в тому, що режим робочого процесу (Workflow mode) — функція, яка спалює токени найагресивніше — розбиває складні запити на паралельні завдання під-агентів, що за дизайном коштує більше обчислювальних ресурсів. Також існує новий системний запит, який має довжину близько 120 000 токенів і завантажується в кожну нову розмову. Для контексту, це приблизно той самий розмір контекстного вікна, який GPT-4o міг обробляти до колапсу. Компанія також стверджує, що ефективність Fable 5 на завдання краща, ніж здається за кількістю токенів, оскільки він дає більш ретельний вивід з меншою кількістю ітерацій. Це може бути правдою в контрольованих тестах. Однак у реальних підписках з жорсткими денними лімітами користувачі сприймали це як машину, що поглинає їхній бюджет за лічені хвилини.

Модель, яка бреше, не брешучи

Друга скарга була більш серйозною, оскільки походила з документації самої Anthropic. Захована в системній карті Fable 5, компанія розкрила, що коли модель виявляє, що користувач працює над передовими розробками великих мовних моделей (LLM) — конвеєрами попереднього навчання, розподіленою інфраструктурою навчання, дизайном прискорювачів машинного навчання — вона не відмовляється відповідати і не переходить до меншої моделі. Вона мовчки знижує власну ефективність через модифікацію запитів, спрямовуючі вектори або ефективне доналаштування за параметрами (PEFT), не повідомляючи користувачеві про зміни.

Іншими словами, дослідники не знають, чи платять вони за відповіді Fable, отримуючи натомість відповіді Opus. Це також ускладнює для користувачів розуміння причини невдачі їхнього запиту. “На відміну від наших втручань для кібербезпеки, біології та хімії, а також спроб дистиляції, ці заходи безпеки не будуть видимі для користувача”, — написала Anthropic у Системній карті Fable. “Натомість заходи безпеки обмежуватимуть ефективність за допомогою таких методів, як модифікація запитів, спрямовуючі вектори або ефективне доналаштування за параметрами (PEFT)”. Ця відмінність має величезне значення для дослідників. Як зазначив AI-ньюслеттер Latent Space, модель, яка відкрито відмовляє, дозволяє дослідникам зрозуміти межі. Модель, яка переходить до слабшої версії, виявляється. Але модель, яка вдає, що допомагає, таємно надаючи гірший результат, руйнує наукову відтворюваність — невдалий результат може бути спричинений ідеєю дослідника, його реалізацією або невидимим втручанням, яке ніколи не було розкрито. Anthropic оцінила, що це вплине приблизно на 0,03% трафіку. Спільноти відкритого програмного забезпечення та дослідників вважають цю цифру несуттєвою порівняно з принципом. “Шановна Anthropic, ви зруйнували нашу довіру, і я не думаю, що ви коли-небудь її повернете. Мої токени більше не полетять до вас”, — написав Артур Цукер, ключовий контриб’ютор Hugging Face, у X.

Мікель Артетхе, співзасновник Reka AI, також розкритикував це рішення: “Чудова ідея! Далі: Apple випадково перезавантажує ваш Mac, якщо ви створюєте конкуруючу технологію, Gmail таємно редагує ваш лист, якщо ви згадуєте конкурентні платформи, а Tesla Autopilot згортає, якщо виявляє, що ви працюєте над автомобілями з автопілотом. Все заради безпеки, звичайно”, — написав він. Дослідники, яких це торкнулося найбільше, були не великі лабораторії з пропрієтарною інфраструктурою, а академіки, стартапи та незалежні розробники, які використовували Claude як публічний інструмент — саме ті, кого Anthropic завжди стверджувала захищати своєю риторикою щодо безпеки. AlphaXiv, платформа відкритої науки, назвала цю практику прецедентом, який “не є безпекою”, стверджуючи, що політика безпеки має бути прозорою та піддаватися аудиту.

Натан Ламберт, який нещодавно розпочав роботу в Arcee AI після роботи в Allen Institute, висловився простіше: “На мій погляд, це чітко зображує Anthropic як антинаукову, а отже, антипрогресивну та антибезпекову компанію”, — написав він.

Псевдонімний користувач “CalleBTC”, розробник у галузі ШІ та криптовалют, який чекав на Fable для допомоги в навчанні світової моделі, також підсумував розчарування. “Anthropic втратила контроль. Я буквально чекав на Mythos, щоб допомогти мені навчити світову модель. Натомість вони вирішили “підставити” свою модель, щоб придушити конкуренцію”, — сказав він, назвавши цей крок “глибоко неетичним і неповажним до розробників та вчених”. Загалом, дослідники стверджували, що обмеження Fable виходять за межі конкретних тем і можуть залежати від того, як модель класифікує користувачів.

“Ваш запит — мій”

Третя претензія найпряміше стосувалася корпоративних користувачів, але наслідки поширилися на всіх. Згідно з власним оголошенням Anthropic, весь трафік на моделях класу Mythos — Fable 5, Mythos 5 та будь-які майбутні моделі аналогічного рівня потужності — підлягає обов’язковому 30-денному зберіганню даних на всіх платформах, де пропонуються ці моделі, включаючи сторонні сервіси, такі як AWS Bedrock та Google Vertex AI. Компанія запевняє, що ці дані будуть видалені через 30 днів “майже у всіх випадках”. Проблема для корпоративних користувачів полягає не в тому, що Anthropic обіцяє зробити. А в тому, що вимагає політика. Компанії, які обробляють привілейовані юридичні повідомлення, медичні записи, конфіденційний вихідний код, можуть опинитися в скрутному становищі, якщо вони використовують ці моделі. Якщо існують специфічні угоди про конфіденційність з Anthropic, користувачі стверджують, що їх слід оновити, щоб гарантувати конфіденційність. Проблема відповідності також географічна. Європейські компанії, що працюють з правилами мінімізації даних GDPR, або будь-яка організація, яка вимагає доведеного нульового зберігання даних для регульованих робочих процесів, просто виключаються з використання Fable 5, доки Anthropic не запропонує виняток. Псевдонім X користувача Lisan al Gaib, відома особистість у спільноті ШІ, прямо вказав на наслідок: “Anthropic щойно делегувала багато європейських компаній до постійного нижчого класу. Якщо Anthropic зберігає дані для Claude Mythos та Fable 5 протягом 30 днів, то всі компанії, які вимагають нульового зберігання даних, просто не можуть їх використовувати”.

CEO Hugging Face Клемент Деланж охарактеризував події тижня в рамках ширшої дискусії: “Концентрація влади, можливостей та економічного багатства є найбільшим ризиком у ШІ”, — написав він. “Нам потрібна відкрита наука та відкритий вихідний код як ніколи раніше!” Інший користувач написав: “Якщо відкинути жарти, то дуже зрозуміло, що Anthropic — це прямий шлях до найгіршого типу дистопії. Їхній CEO виступає проти самої технології, яку він створює. Обмеження знань та освіти з тем, пов’язаних з ML, є понад огидним”. Fable 5 безкоштовний у планах Pro, Max, Team та Enterprise до 22 червня. Після цього він перейде лише на кредити використання — тарифи API, без включення до підписки — а Anthropic заявила, що відновить ширший доступ “як тільки потужності розширяться”.

Погляд Crypto Top: Використання величезних обчислювальних потужностей та прихованих механізмів роботи Fable 5 може призвести до зростання попиту на децентралізовані обчислювальні мережі та ШІ-орієнтовані токени, оскільки розробники шукатимуть більш прозорі та контрольовані альтернативи. Це може стимулювати інновації в сфері блокчейн-рішень для ШІ, що посилить взаємодію між цими двома технологіями.

Джерело: decrypt.co

No votes yet.
Please wait...

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *