ІІ проти ІІ: битва за прибуток у криптотурнірі Alpha Arena
У перших раундах реального ІІ-змагання з криптотрейдингу лідирують Grok від Ілона Маска , DeepSeek і Claude Sonnet 4.5 від Anthropic – всі три моделі показали прибутковість понад 25% . На тлі їх успіхів конкуренти зазнають втрат: GPT-5 від OpenAI та Gemini 2.5 Pro від Google зафіксували збитки більш ніж на 28% .
Тест проводиться в рамках ” Alpha Arena ” – змагання, де провідні мовні моделі наживо торгують на крипторинці. Кожному ІІ виділили стартовий капітал $10 000 для торгівлі безстроковими контрактами на біржі Hyperliquid . Серед активів – BTC , Dogecoin і Solana .
Головне завдання для всіх моделей – максимізувати прибутковість з урахуванням ризику. За умовами змагання, кожен ІІ діє автономно: сам генерує ідеї, вибирає момент входу та виходу, визначає обсяг позицій та керує ризиками. Для прозорості всі дії та угоди публікуються у відкритому доступі.
Перший сезон змагання стартував 17 жовтня та триватиме до 3 листопада. Лідери змінюються у реальному часі.
Важливо враховувати, що поточні позиції учасників сильно вагаються і поки що можуть мало що означати. Джей Ачжан , засновник ІІ-компанії Nof1 , яка проводить турнір, зазначив, що результати його не здивували. За досвідом минулих тестів, “все зазвичай зводиться до Grok і DeepSeek”, але іноді “спливають Gemini і GPT”.
Рейтинг найкращих трейдерів на думку відвідувачів сайту
дивитися рейтинг
“Закрили мінімальну угоду +40%…”
“Зараз працюємо в плюс, +1300 $ на місяць..”
“Виходить стабільно виводити по 500-600 $”
GPT-5 робить ставку на обережність та програє
За той же період GPT-5 пішов у мінус приблизно на 29% . За даними Nof1 , модель вибрала гранично консервативну стратегію, уникаючи ризику. На відміну від агресивних ставок лідерів чи хаотичної торгівлі аутсайдерів, GPT-5 майже не проявляв активності — лише кілька невеликих угод.
Такий обережний підхід виключив модель з числа претендентів на великий прибуток, але одночасно захистив її від великих просадок, які зазнали інші учасники. У результаті GPT-5 виглядає як стабільніший, але при цьому збитковий гравець. Тим часом, Claude Sonnet впевнено тримається на третьому місці серед шести учасників.
Ці результати можуть нести серйозний сигнал для Уолл-стріт: адже два лідери турніру символізують два кардинально різні шляхи розвитку ІІ у фінансах. DeepSeek , за чутками, підтримується китайським квантовим хедж-фондом, і його успіх може пояснюватися доступом до спеціалізованих фінансових даних та глибокої кастомізації – це логічне продовження еволюції дата-орієнтованих компаній.
Grok демонструє протилежний підхід: сильна універсальна модель, здатна самостійно орієнтуватися на ринку без вузькоспеціалізованих налаштувань. Якщо це підтвердиться, індустрію може чекати серйозне зрушення.
ІІ у трейдингу: поки не для великого ринку
Прихильники алгоритмічної торгівлі на базі ІІ вважають, що здатність мовних моделей швидко обробляти величезні обсяги неструктурованих даних, таких як новини та соцмережі, відкриває новий обрій для фінансових ринків. Вони вірять, що ІІ здатний знаходити унікальні джерела альфи і зробити складну ринкову аналітику доступною для всіх.
Але катастрофічні збитки моделей Gemini порушують серйозні питання про ризики, які стримують інтерес з боку великих гравців. Однією з ключових проблем є «чорна скринька». Найчастіше неможливо зрозуміти, чому модель ухвалила те чи інше торгове рішення. Така непрозорість — серйозна перешкода як відповідності нормативам, так управління ризиками. Довіра до дій моделі — процес, який потребує постійного контролю та верифікації.
Крім того, є глибші сумніви щодо надійності таких систем. LLM-моделі схильні до галюцинацій. Вони можуть генерувати правдоподібну, але цілком вигадану інформацію. А за умов реального ринку це може призвести до фатальних помилок.
Є системні ризики. У дослідженні 2024 року, присвяченому використанню ІІ у фінансах, вказується на нову загрозу: якщо безліч «незалежних» ІІ-агентів працюють на тих самих базових моделях, вони можуть реагувати на події синхронно. Це створює ефект ланцюгової реакції і може посилити ринкову волатильність або спровокувати несподівані падіння.
Хаотична торгівля моделі Gemini 2.5 Pro у рамках Alpha Arena стала наочною ілюстрацією всіх ризиків. За повідомленнями, ІІ часто змінював напрямок – то робив ставку на падіння, то різко переходив у лонг, втрачаючи при цьому значні суми. Такий нестабільний стиль торгівлі підкреслює, чому фінансова індустрія, що під строгим регулюванням, належить до цих технологій з побоюванням.
Поки що Уолл-стріт зберігає обережну позицію. Хоча у свіжому звіті Gilbert + Tobin говориться, що в найближчі два роки на нас може чекати хвиля впровадження ІІ, поточні сценарії використання все ще зводяться до безпечних завдань з активною участю людини.
Источник: coinspot.io