OpenAI випустила найпотужнішу модель на тлі бойкоту через угоду з Пентагоном.

Створіть обліковий запис, щоб зберегти свої статті.Додати в GoogleДодайте Decrypt як улюблене джерело, щоб бачити більше наших історій у Google.
Коротко
- OpenAI запустила GPT-5.4 на тлі зростаючого невдоволення QuitGPT через контракт з Пентагоном.
- GPT-5.4 отримує контекстне вікно на 1 мільйон токенів, покращену логіку та агентні можливості.
- Корпоративні користувачі виграють найбільше, оскільки GPT-5.4 надає швидші ШІ-агенти з меншою кількістю токенів.
OpenAI почала розгортання GPT-5.4 — своєї найпотужнішої моделі на сьогодні — у четвер, намагаючись подолати кризу у сфері PR, яка призвела до того, що приблизно 2,5 мільйона користувачів вжили заходів проти компанії, скасувавши підписку або поділившись бойкотом у соціальних мережах.
Так званий рух QuitGPT вибухнув після того, як OpenAI оголосила про угоду з Міністерством оборони США через кілька годин після того, як Anthropic публічно відмовилася від того ж контракту, за що отримала суспільний осуд від президента Трампа та інших урядовців.
Причина відмови Anthropic: Міністерство оборони відмовилося включити положення, яке явно забороняє розгортання автономної зброї та масового стеження за громадянами США.
OpenAI все ж таки взялася за угоду. Генеральному директору Сeму Альтману, який відповідає на запитання про очевидну розбіжність між заявленими червоними лініями безпеки його компанії та фактичним формулюванням контракту, потрібні ці користувачі назад.
Ось тут і з’являється GPT-5.4… лише через два дні після представлення GPT-5.3.
Нова модель об’єднує можливості міркування, кодування та роботи ШІ-агентів в одному релізі. Вона також має контекстне вікно на 1 мільйон токенів, що означає більше свободи для користувачів у обробці великих обсягів інформації за одну сесію.
На папері цифри виглядають обнадійливо. За результатами бенчмарку GDPval, який тестує інтелектуальну роботу в 44 професіях, GPT-5.4 відповідає або перевершує професіоналів у 83,0% порівнянь, порівняно з 70,9% для GPT-5.2. Найбільший стрибок спостерігається у використанні комп’ютера: на OSWorld-Verified, який вимірює здатність моделі керувати робочим столом за допомогою скріншотів та дій клавіатури/миші, GPT-5.4 досягає 75,0% успіху порівняно з 47,3% у GPT-5.2 — і перевищує людську норму в 72,4%.
На BrowseComp, тесті глибокого веб-дослідження, показник зростає на 17 процентних пунктів порівняно з GPT-5.2. 1 мільйон токенів контекстного вікна та функція керування відповіддю посередині — що дозволяє користувачам перенаправляти модель, поки вона ще обмірковує — доповнюють ключові можливості.
Ця функція заощаджує час та обчислювальні ресурси, уникаючи необхідності відкидати всі раніше згенеровані токени при виявленні помилки.
Хто отримає вигоду від GPT 5.4?
Важливо зазначити, що деякі бенчмарки переважно порівнюють GPT-5.4 — і здебільшого логіка встановлена на “надзвичайно високі зусилля”, що безкоштовні користувачі та користувачі Plus не можуть насолоджуватися — з GPT-5.2, повністю пропускаючи GPT-5.3.
Для користувачів, які вже використовують GPT-5.3, деякі покращення можуть здатися більш інкрементальними, ніж показують графіки.

Кодерам найбільше варто приборкати очікування: на SWE-Bench Pro покращення з GPT-5.3-Codex (56,8%) до GPT-5.4 (57,7%) — це майже помилка округлення. Модель також вимагає значно менше токенів для виконання завдань порівняно з GPT-5.2.
«GPT‑5.4 — це наша найефективніша модель для міркувань на сьогодні, яка використовує значно менше токенів для вирішення проблем порівняно з GPT‑5.2», — заявили в OpenAI.
Тим не менш, будь-яке покращення в цій галузі є позитивним для розробників, які використовують моделі OpenAI через API і платять за кожен використаний токен. Модель з ефективним ланцюжком міркувань може надавати ті ж результати за частку вартості порівняно з моделлю, яка схильна до надмірних роздумів, щоб забезпечити належний висновок.
Є ще одна деталь для тих, хто сподівається використовувати нову модель прямо зараз: OpenAI стверджує, що GPT-5.4 буде випущено сьогодні, але на момент написання статті вона ще не була доступна, тому, ймовірно, розгортається повільно. Для більшості користувачів найкращою моделлю є GPT 5.3, і її можна використовувати лише для миттєвих відповідей, що означає, що вона надає відповіді, які не вимагають надмірних зусиль.
Користувачі, які покладаються на “роздуми” — термінологія OpenAI для розширеного ланцюжка міркувань над складними завданнями — все ще використовують GPT-5.2. Іншими словами, користувачі, які, найімовірніше, будуть розширювати межі можливостей моделі, останніми її отримують.

Найбільшими бенефіціарами є корпоративні користувачі, які займаються роботою з великою кількістю документів. У внутрішньому бенчмарку моделювання електронних таблиць GPT-5.4 показав 87,3% проти 68,4% у GPT-5.2. Юридична дослідницька фірма Harvey повідомила про 91% на своїй оцінці BigLaw Bench. Mainstay, яка керує агентами на 30 000 порталах податку на нерухомість, повідомила про 95% успіху з першої спроби та про сесії, які працюють “приблизно в 3 рази швидше, використовуючи приблизно на 70% менше токенів”.
Це саме той тип аргументу про ефективність, який може мати значення для корпоративних відділів закупівель, але його важче продати індивідуальному користувачеві, який роздумує, чи видаляти свій обліковий запис.
Погляд Crypto Top: Впровадження GPT-5.4 з його розширеними можливостями ШІ-агентів та ефективністю використання токенів може кардинально змінити ландшафт Web3, сприяючи створенню більш складних децентралізованих додатків та нових моделей монетизації, пов’язаних з обчислювальними потужностями. Зростання ефективності в обробці завдань також може посилити роль власних токенів у екосистемах, що базуються на ШІ, через зниження операційних витрат.
Джерело: decrypt.co
