ChatGPT “помолодшав”: користувачі помітили різке зростання інтелекту моделі

Користувачі OpenAI підозрюють непомітне тестування GPT-5.6 у ChatGPT

ChatGPT "помолодшав": користувачі помітили різке зростання інтелекту моделі 2

Створіть обліковий запис, щоб зберегти свої статті.Додати в GoogleЗробіть Decrypt своїм пріоритетним джерелом, щоб бачити більше наших історій у Google.

Коротко

  • Користувачі X повідомляють про покращену якість вихідних даних та незвично тривалий час відгуку в ChatGPT і Codex цього тижня.
  • Деякі користувачі відзначили значне покращення результатів у вебдизайні та створенні 3D-відеоігор за допомогою ChatGPT.
  • Згідно з чутками, офіційний реліз GPT-5.6 очікується наступного тижня, але OpenAI поки не оголошувала про свої плани.

Цього тижня щось змінилося в ChatGPT — і багато хто це помітив одночасно.

У соціальній мережі X користувачі протягом останніх двох днів ділилися скріншотами та результатами вимірювання часу, що вказувало на одну теорію: OpenAI непомітно проводить A/B тестування GPT-5.6 в рамках ChatGPT, замінюючи ним GPT-5.5 Pro для деяких користувачів.

Розробник Аншу Чімала опублікував у четвер відео порівняння лендінг-пейджів, створених за одним запитом, підписавши його: «Ну-ну-ну, я один із щасливчиків, хто має ранній доступ до GPT-5.6 Pro».

Розробник Доброслав Радосавлєвіч написав у X, що те, що він запускає в Codex, інструменті OpenAI для програмування, «відчувається значно відмінним від моделі 5.5». У коментарях під його дописом думки розділилися: одні повірили, інші назвали це ефектом плацебо.

Найбільш вираженою закономірністю, що спостерігається в публікаціях, є час. Конор Дарт, один із багатьох користувачів X, які поширюють чутки, провів тест, створивши 3D-гру для браузера за один запит — з фізикою та керуванням камерою. Генерація зайняла трохи більше години, тоді як GPT-5.5 Pro зазвичай потребував близько 10 хвилин.

«Не ідеально, але для тесту розробки гри за один запит це надзвичайно вражаюче», — написав Дарт.

Інсайдер у сфері ШІ Чітас Луа повідомив про подібне уповільнення під час тестування симуляції роботів, також будучи впевненим, що його результати походять від нової моделі OpenAI: «GPT 5.6 Pro продовжує перевершувати [Fable 5 від Anthropic] у 3D-тестах. Працює над іграми також за один запит».

В окремому пості він зазначив, що час відгуку збільшився до 20 або 40 хвилин — темп, який, за його словами, не спостерігався з часів, що передували випуску GPT-5.5.

Не всі порівняння були на користь чуток про нову модель. Кріс, фахівець з тестування ШІ на X, дав двом моделям однаковий запит на побудову космічного корабля — підозрюваний GPT-5.6 Pro працював 87 хвилин проти 34 хвилин 42 секунд у GPT-5.5 Extra High.

«Як я вже казав раніше, базуючись на авторитетних джерелах, GPT-5.6 буде поступовим/солідним покращенням порівняно з GPT-5.5, а не вбивцею Fable», — написав він, зауваживши, що Fable 5 все ще перевершував обидві моделі в основній геометрії космічного корабля. «Мої приблизні очікування полягали в тому, що він буде конкурувати з Fable 5 на деяких тестах, можливо, виграючи приблизно в половині залежно від категорії, але не перевершуючи його загалом».

В окремому пості, що приписується витоку інформації від Панкаджа Кумара, деталізуються чутки: термін актуальності знань перенесено на грудень 2025 року, налаштування зусиль для міркувань, яке деякі тестувальники називають «Juice Value», нібито підвищено з 768 до 960, а генерація SVG та 3D-дизайну стала настільки потужною, що перевершує Fable 5 у деяких завданнях.

Жодна з цих деталей не надходить від OpenAI, але вони узгоджуються між різними джерелами: посилене міркування, незавершений фронтенд та випускний кандидат під кодовою назвою Kindle-Alpha.

AI-інфлюенсер Лео, посилаючись на неназвані джерела, написав у своїй стрічці, що підозрювана модель «зараз таємно тестується під час вибору 5.5 Pro в ChatGPT», принаймні для деяких Pro-акаунтів, з планованим публічним запуском наступного четверга, 25 червня.

Найближчим до відбитка OpenAI є внутрішня записка, а не твіт. Головний науковий співробітник Якуб Пачокі, за повідомленнями The Information, повідомив співробітникам, що наступна модель є значним покращенням порівняно з GPT-5.5. Це все ще не підтвердження A/B тестування, дати випуску чи будь-яких характеристик, що циркулюють у X, але це підтверджує, що нова модель перебуває в розробці.

Decrypt звернувся до OpenAI з запитанням, чи тестується GPT-5.6 в рамках ChatGPT, але компанія не відповіла на момент публікації.

Чому OpenAI може поспішати

Якщо OpenAI поспішає з випуском нової флагманської моделі, то для цього є причини. Відкрита модель Китаю GLM-5.2 відстає від Claude Opus 4.8 лише на один бал у FrontierSWE — бенчмарку, який оцінює ШІ-агентів за багатотисячними, відкритими інженерними проєктами за показником домінування — водночас перевершуючи GPT-5.5 у тому ж тесті.

Тим часом Anthropic стикається з проблемами, спричиненими власними діями. Флагманські моделі компанії Mythos 5 та Fable 5 залишаються вилученими відповідно до директиви США щодо експортного контролю від 12 червня через суперечливу вразливість до “джейлбрейку”, залишаючи прогалину на ринку, яку прагнуть заповнити GLM-5.2 та гіпотетичний GPT-5.6.

Якщо генеральний директор Anthropic Даріо Амодей та президент Дональд Трамп досягнуть миру, то Fable 5 буде значно потужнішою за будь-яку іншу доступну наразі модель, а розрив у якості між найкращою моделлю Anthropic та моделлю OpenAI стане набагато більшим, ніж раніше.

Також є фінансовий аспект. OpenAI, за повідомленнями Wall Street Journal, розглядає можливість зниження цін на токени, які вона стягує з розробників та підприємств, очікуючи, що Anthropic зробить те саме, оскільки обидві компанії готуються до конкурентних IPO.

Чи призведе все це до фактичного випуску GPT-5.6, може підтвердити лише OpenAI, і компанія зберігала мовчання протягом тижня чуток про витоки даних та заяви про таємне тестування. Однак трейдери Polymarket не чекають — контракти на запуск між 22 та 28 червня цього тижня досягали 89%.

Погляд Crypto Top: Непомітне впровадження нових моделей ШІ, як-от GPT-5.6, може стимулювати інтеграцію передових обчислювальних можливостей у децентралізовані мережі, що потенційно підвищить цінність токенів, пов’язаних з обчислювальними ресурсами або ШІ-орієнтованими протоколами.

Джерело: decrypt.co

No votes yet.
Please wait...

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *