Дослідники з Каліфорнійського університету в Сан-Дієго заявили, що сучасні моделі штучного інтелекту вже здатні успішно проходити тест Тюрінга під час живого спілкування. Ба більше, у новому експерименті модель GPT-4.5 частіше здавалася людям «справжньою людиною», ніж реальні учасники розмови.
ШІ навчився проходити тест Тюрінга краще за людей
Під час дослідження вчені використали складнішу версію класичного тесту Тюрінга. Судді одночасно спілкувалися в чаті з людиною та ШІ-моделлю, не знаючи, хто є ким. Після короткої живої бесіди їм потрібно було визначити, де реальна людина, а де програма.
Результат виявився доволі несподіваним. GPT-4.5 у 73% випадків переконувала співрозмовників, що по той бік екрана сидить людина. Інша модель — LLaMa-3.1-405B — також показала високий результат і отримала «людський» статус у 56% випадків.
Загалом у тестах брали участь GPT-4.5, GPT-4o, LLaMa-3.1-405B та навіть старий чат-бот ELIZA 1960-х років. Найкращий результат показала GPT-4.5 з так званим «persona prompt» — спеціальним налаштуванням поведінки моделі. У такому режимі чат-бот поводився як інтровертний молодий користувач, який добре знається на інтернет-культурі та використовує сленг. Саме ця модель змогла пройти тест у 73% випадків, тобто люди частіше обирали ШІ як «справжню людину», ніж реального співрозмовника.
Без додаткового налаштування поведінки результати були значно слабшими: GPT-4.5 набрала лише 36%, а LLaMa — 38%. Для порівняння, GPT-4o отримала 21%, а ELIZA — 23%.
Дослідження охопило понад 1000 окремих розмов. Учасники листувалися протягом 5 хвилин, а в окремому тесті — 15 хвилин. Навіть у довших бесідах деякі моделі зберігали високий рівень «людяності», демонструючи результат до 59%.
📈 Більше новин про крипто-світ читайте на CryptoTop.info!
