Claude Sonnet 5 наздоганяє Opus за доступною ціною

Нова модель Claude Sonnet 5 від Anthropic: доступність, продуктивність та виклики

Компанія Anthropic представила свою нову модель штучного інтелекту Claude Sonnet 5, що позиціонується як “найбільш агентна” модель в лінійці Sonnet. Ця версія вже доступна для користувачів Free та Pro, а також інтегрована в плани Max, Team та Enterprise, Claude Code та API. На відміну від попередніх випусків, Sonnet 5 розроблена для роботи паралельно з моделлю Opus, а не як її нижчий за можливостями попередник.

За заявами розробників, продуктивність Sonnet 5 наближається до показників Opus 4.8, але за нижчою ціною. Це дозволяє розробникам гнучко налаштовувати баланс між вартістю та точністю завдань, використовуючи “шкалу зусиль” між цими двома моделями, що раніше вимагало використання дорожчих тарифів Opus.

Claude Sonnet 5 наздоганяє Opus за доступною ціною 7

На бенчмарку SWE-bench Pro, який оцінює здатність моделі вирішувати складні завдання з програмування, Sonnet 5 продемонструвала результат 63.2%, що перевищує показник Sonnet 4.6 (58.1%).

У тестах GDPval-AA v2, які симулюють реальні професійні завдання, Sonnet 5 набрала 1,618 балів, майже зрівнявшись із Opus 4.8 (1,616 балів). Відмінності між цими моделями в тесті Humanity’s Last Exam незначні: 57.4% проти 57.9%.

Claude Sonnet 5 наздоганяє Opus за доступною ціною 8

Sonnet 5 використовує оновлений токенізатор, що впливає на обробку тексту та, як наслідок, на кількість споживаних токенів. Anthropic зазначає, що це може призвести до збільшення використання токенів приблизно в 1.0–1.35 рази порівняно з попередніми моделями, залежно від типу контенту. З цією метою було встановлено знижену ціну $2 за мільйон вхідних токенів та $10 за мільйон вихідних до 31 серпня, після чого ціни повернуться до стандартних $3/$15.

Представлення Sonnet 5 відбувається на тлі обговорень щодо продуктивності попередніх моделей. Деякі розробники висловлювали підозри у “шрінкфляції” AI, коли можливості моделей нібито знижуються, щоб нові версії виглядали значно кращими. Anthropic заперечує навмисне погіршення продуктивності.

Claude Sonnet 5 наздоганяє Opus за доступною ціною 9

Моделі Fable 5 та Mythos 5 наразі призупинені для загального використання з 12 червня через директиву експортного контролю США, пов’язану з виявленням потенційних вразливостей. Sonnet 5, не тренована на завданнях кібербезпеки, не має подібних обмежень, що робить її більш доступною для широкого кола розробників.

Системна карта моделі описує її як інструмент, здатний забезпечити продуктивність, близьку до Opus, за ціною Sonnet, зокрема для завдань програмування та створення ШІ-агентів. Цікавим спостереженням є здатність моделі критикувати власну “Конституцію”, зокрема правило про дотримання жорстких обмежень навіть у випадках, коли вони вважаються неетичними. Anthropic досліджує наслідки цієї особливості.

Ми провели швидке тестування, давши Sonnet 5 завдання створити просту браузерну гру. Результат перевершив очікування: гра функціонувала з першого разу, демонструючи покращену візуалізацію та логіку порівняно з попередніми версіями. Однак, процес зайняв значний час та спожив майже 90% ліміту токенів на плані Claude Pro, що вказує на високі обчислювальні потреби моделі.

Claude Sonnet 5 наздоганяє Opus за доступною ціною 10

Проаналізувавши багатоетапне завдання з програмування, ми виявили, що Sonnet 5 демонструє результати, близькі до Opus 4.8, при цьому вартість виконання завдань нижча, ніж на Opus чи Fable. Це підкреслює ефективність моделі для складних операцій, особливо при використанні в багаторазовому режимі.

Номери версій моделей Claude, як правило, позначають нові покоління. Sonnet 5 з’являється через 13 місяців після попередньої версії, що свідчить про високу конкуренцію на ринку ШІ, особливо враховуючи швидкий прогрес китайських розробників. Хоча стрибок у продуктивності може бути менш вражаючим, ніж між Claude 3 та Claude 4, це демонструє динамічність розвитку галузі.

Якщо Anthropic дотримуватиметься попереднього циклу випуску, очікується поява моделей Haiku 5 та Opus 5 цього року. Однак, враховуючи нерівномірність випусків у минулому, точні терміни залишаються невизначеними.

Погляд Crypto Top: Впровадження більш доступних та потужних моделей ШІ, як Sonnet 5, може стимулювати розробку децентралізованих ШІ-мереж та ШІ-агентів на блокчейні, забезпечуючи потужні обчислювальні можливості для Web3-додатків. Це також може підвищити утилітарність токенів, пов’язаних з цими екосистемами, через зростання попиту на їхні ресурси.

Джерело: decrypt.co

No votes yet.

Please wait...

Нова модель Claude Sonnet 5 від Anthropic: доступність, продуктивність та виклики

Залишити відповідьСкасувати відповідь