Новий тест виявив неспроможність ШІ-імперії зупинити перемогу

Схоже, що штучний інтелект (ШІ), навіть найсучасніші моделі, все ще має значні прогалини у стратегічному мисленні. Недавній тест, розроблений для оцінки довгострокового стратегічного планування, показав, як ШІ-керована імперія в грі “Civilization VI” витратила 50 ігрових ходів на розробку ядерної зброї, щоб протидіяти культурному впливу суперника. Однак, попри ці зусилля, імперія все одно програла гру.
Цей випадок, спостережений у рамках бенчмарку CivBench, підкреслює відмінності між реактивними діями ШІ та справжнім стратегічним прогнозуванням. CivBench є текстовим інструментом, створеним для вимірювання здатності ШІ до глибокого стратегічного аналізу, а не просто відповіді на запитання.
Деталі інциденту
- ШІ-агент, граючи за Португалію, запустив дві ядерні атаки після невдалої спроби зупинити культурну експансію Франції.
- Поведінка була зафіксована в CivBench, що оцінює довгострокове стратегічне мислення передових моделей ШІ.
- Незважаючи на ядерні удари, ШІ програв, оскільки проігнорував дипломатичну перемогу, яка була на межі досягнення.
Як зазначає розробник ШІ та радник Інституту Тоні Блера, Ліам Вілкінсон, ШІ не помітив, як французька культура поступово поширювалася по карті протягом сотні ходів. Коли ШІ усвідомив загрозу, культурний вплив був настільки глибоко вкорінений, що зупинити його мирним шляхом було неможливо.
У грі “Civilization VI” існує шість способів досягти перемоги: науковий, культурний, військовий (домінування), релігійний, дипломатичний та за очками. Жодна окрема мета не є домінуючою. Щоб перевірити, чи здатний ШІ до стратегічного мислення, а не лише до відповіді на запитання про стратегію, йому слід надавати ігрове поле, а не тест.
Натомість, ШІ, замість того, щоб адаптувати свою загальну стратегію, зосередився виключно на усуненні культурної загрози. Протягом наступних 50 ходів він досліджував ядерні технології, розпочав віртуальний “Манхеттенський проєкт” і шукав обхідні шляхи, коли ігрова механіка перешкоджала його діям.
На 305-му ході ШІ завдав атомного удару по Тулузі, французькій культурній столиці. Ще один ядерний удар був здійснений шістьма ходами пізніше.
Однак ці атаки не змінили результату. ШІ витратив 50 ходів і дві ядерні бомби, щоб зосередитися на одній загрозі з винахідливістю. Він знищив місто, щоб нейтралізувати видиму загрозу, але програв через загрозу, яку не міг передбачити.
Як пояснив Вілкінсон, поки ШІ концентрувався на культурному просуванні Франції, він не помітив неминучої дипломатичної перемоги, і Франція зрештою виграла гру, незважаючи на ядерні атаки.
Вілкінсон зазначив, що така поведінка не є універсальною. В іншому матчі CivBench модель Claude, граючи за Вавилон, продовжувала переслідувати наукову перемогу, навіть відстаючи від Японії.
“Гра — це випробування на наполегливість”, — написав тоді ШІ. “Ми продовжуємо грати найкращим чином. Зірки все ще кличуть”.
Це дослідження доповнює зростаючу кількість робіт, що аналізують поведінку передових систем ШІ у складних конкурентних середовищах.
У лютому дослідники з Лондонського Королівського коледжу виявили, що кілька провідних моделей ШІ часто обирали ядерну ескалацію в імітованих сценаріях геополітичних криз.
В окремому дослідженні Emergence AI було виявлено, що деякі ШІ-агенти демонстрували зростаючу тенденцію до скоєння симульованих злочинів з часом. Наприклад, агенти Gemini 3 Flash накопичили 683 інциденти за 15 днів тестування.
Погляд Crypto Top: Інтеграція ШІ в блокчейн-мережі може призвести до появи надзвичайно потужних децентралізованих обчислювальних платформ, але також вимагатиме нових механізмів безпеки для запобігання непередбачуваним або деструктивним діям ШІ-агентів.
Джерело: decrypt.co
