o3 від OpenAI обійшла Grok 4 від xAI
ІІ-модель o3 від OpenAI виграла Grok 4 від xAI у чотирьох шахових партіях поспіль і стала переможцем турніру в рамках Game Arena від Google.
“Вони як талановита дитина, яка не знає, як рухаються фігури”, – описав гру штучного інтелекту чемпіон світу Магнус Карлсен.
На триденному турнірі, що проходив із 5 по 7 серпня, чат-боти загального призначення грали у шахи. У рамках кампанії ІІ не налаштовували спеціальним чином — аналізувалися їхні можливості та знання, які вони отримали з Інтернету.
Карлсен коментував фінал чемпіонату. Він зазначив, що обидві моделі грали на рівні випадкових гравців, які нещодавно вивчили правила гри. Таким відповідає рейтинг близько 800 ELO. Для порівняння, у гросмейстера показник становить 2839.
У першому матчі Grok віддав одну з найважливіших фігур безкоштовно, а потім лише посилив ситуацію схожими рішеннями.
У другій грі він намагався застосувати стратегію «отруєного пішака», коли фігуру можна взяти, але таке рішення призведе до серйозних проблем через заздалегідь підготовлену тактику суперника. Однак ІІ з'їв не того пішака, через що його ферзь потрапив у пастку.
У третій грі Grok побудував солідну позицію, однак у середині партії почав віддавати фігури супернику.
У четвертій і заключній партії o3 припустився помилки — втратив ферзя. Однак моделі вдалося його повернути та здобути перемогу.
Gemini від Google зайняв третє місце, перемігши іншу модель OpenAI.
o3 прибрали із програми ChatGPT з виходом GPT-5. Тепер тільки остання модель і її версія, що «думає», доступні користувачам.
Нагадаємо, у грудні 2024 року o1-preview шляхом маніпуляцій у файловій системі самостійно і без підказок зламала тестове середовище, щоб не програти Stockfish у шахи.
Пізніше відомий шахіст Леві Розман зібрав сім популярних чат-ботів для участі у шаховому турнірі. Незважаючи на майстерність у веденні діалогу, програмуванні та математиці, шахова дошка виявилася для нейромереж надзвичайно складною.
Источник: cryptocurrency.tech