Нові малі моделі OpenAI: швидкість та ефективність для повсякденних завдань.
Створіть обліковий запис, щоб зберігати свої статті.Додати в GoogleДодайте Decrypt як ваше улюблене джерело, щоб бачити більше наших історій у Google.
Коротко
OpenAI представила GPT-5.4 Mini та Nano — дві швидші та дешевші моделі, оптимізовані для високонавантажених ШІ-завдань.
Ці моделі дещо поступаються у точності, але виграють у швидкості та вартості, орієнтуючись на повторювані та прості завдання, такі як підтримка клієнтів та автоматизація робочих процесів.
Розробники тепер можуть створювати гібридні ШІ-системи, де флагманська модель планує завдання, а менші моделі виконують основний обсяг роботи.
OpenAI не сповільнюється. Менш ніж через два тижні після запуску GPT-5.4 — який сам був випущений лише через два дні після GPT-5.3 — компанія представила ще дві моделі: GPT-5.4 Mini та GPT-5.4 Nano.
Це не спрощені версії флагманської моделі, а спеціалізовані інструменти, розроблені для завдань, де очікування відповіді протягом пів хвилини є неприйнятним.
OpenAI називає їх “найбільш здатними малими моделями”, зазначаючи, що GPT-5.4 Mini працює більш ніж удвічі швидше за GPT-5 Mini. Якщо ви коли-небудь спостерігали, як помічник з кодування думає 45 секунд перед редагуванням трьох рядків коду, ви розумієте привабливість швидкої моделі.
We’re introducing GPT-5.4 mini and nano, our most capable small models yet.
GPT-5.4 mini is more than 2x faster than GPT-5 mini. Optimized for coding, computer use, multimodal understanding, and subagents.
For lighter-weight tasks, GPT-5.4 nano is our smallest and cheapest… pic.twitter.com/cdp5HWtM2M
— OpenAI Developers (@OpenAIDevs) March 17, 2026
Отже, навіщо навмисно випускати менш точну модель? Коротка відповідь: тому що точність не завжди є вузьким місцем. Якщо ви керуєте чат-ботом підтримки клієнтів, який щодня відповідає на ті самі 200 запитань, вам не потрібна модель, яка найкраще пройшла тести з хімії рівня PhD. Вам потрібна та, що реагує менш ніж за секунду і коштує частку цента за відповідь. Саме на це орієнтовані ці моделі.
Але це не означає, що ці моделі є “дурними” або ненадійними. На тестах з програмування GPT-5.4 Mini показала 54.4% на SWE-Bench Pro — тесті, що вимірює здатність моделі виправляти реальні проблеми GitHub — порівняно з 45.7% у старого GPT-5 Mini та 57.7% у повного GPT-5.4.
На OSWorld-Verified, який тестує, наскільки добре модель може керувати настільним комп’ютером, читаючи скріншоти, Mini досягла 72.1%, трохи поступаючись флагманській моделі (75.0%) — і обидві перевищують людський рівень (72.4%). Тим часом GPT-5.4 Nano показує 52.4% на SWE-Bench Pro та 39.0% на OSWorld — нижче, ніж Mini, але все ще значний стрибок порівняно з попередніми моделями класу Nano.
«GPT-5.4 демонструє крок вперед для моделей Mini та Nano в наших внутрішніх оцінках», — зазначив заступник технічного директора Perplexity Джеррі Ма після тестування обох. «Mini забезпечує сильне логічне мислення, тоді як Nano є чуйним та ефективним для розмовних робочих процесів у реальному часі».
Замість того, щоб маршрутизувати кожне завдання через дорогий флагманський модель, тепер можна створювати системи, де велика модель планує та координує, тоді як менші моделі паралельно виконують основну роботу — пошук у кодовій базі, читання документа чи обробка форми. Як ми бачили в нашому порівнянні GPT-5.4 проти Grok 4.20, місце моделі в робочому процесі має таке ж значення, як і вибір самої моделі.
GPT-5.4 Mini працює за ціною $0.75 за мільйон вхідних токенів та $4.50 за мільйон вихідних токенів через API. GPT-5.4 Nano ще дешевше: $0.20 за мільйон вхідних токенів та $1.25 за мільйон вихідних токенів — ціна, яка робить виконання величезної кількості запитів на день фінансово реалістичним для стартапів. Для контексту, Nano приблизно в чотири рази дешевше за Mini на вхідних даних.
Для звичайних користувачів ChatGPT, GPT-5.4 Mini доступна сьогодні для безкоштовних користувачів та користувачів Go через опцію “Thinking” у меню Plus. Платні підписники, які досягли лімітів використання GPT-5.4, автоматично переключатимуться на Mini. GPT-5.4 Nano, однак, наразі доступна лише через API — OpenAI чітко позиціонує її як інструмент для розробників, а не для споживачів.
Погляд Crypto Top: Впровадження ефективніших малих ШІ-моделей OpenAI відкриває двері для децентралізованих обчислень та інтеграції ШІ-агентів у Web3-екосистему. Це може значно знизити вартість виконання складних обчислень та взаємодії зі смарт-контрактами, роблячи блокчейн-додатки більш масштабованими та доступними.