“Батько нейромереж” інвестує мільярд у ШІ, що грає на “дурості” користувачів

“`html

"Батько нейромереж" інвестує мільярд у ШІ, що грає на "дурості" користувачів 2

Видатний дослідник Ян Лекун, якого часто називають одним із “батьків сучасних нейромереж”, залучив понад 1 мільярд доларів для свого нового стартапу Advanced Machine Intelligence. Компанія планує розвивати альтернативний підхід до штучного інтелекту (ШІ): не на основі великих мовних моделей (LLM), а на так званих “моделях світу” (world models).

Не інтелект, а генератор слів

Лекун понад десять років очолював дослідницький напрям штучного інтелекту в Meta. Саме він став одним із піонерів згорткових нейронних мереж — технології, що лежить в основі сучасних систем комп’ютерного зору. Втім, дослідник вирішив залишити компанію, аби створити власний стартап і розвинути альтернативне бачення ШІ.

В останні роки індустрія штучного інтелекту розвиває великі мовні моделі — системи, що лежать в основі роботи чатботів і генеративних сервісів. LLM навчаються на величезних обсягах даних і здатні писати тексти та підтримувати складні діалоги. Проте, по суті, вони просто статистично передбачають наступне слово і не мають справжнього розуміння того, про що говорять.

За словами Лекуна, навіть якщо постійно збільшувати масштаб моделей, до рівня справжнього інтелекту вони ніколи не наблизяться. Власне, з новими релізами таких компаній, як OpenAI, Meta та Google, різниця з попередніми версіями стає все менш помітною.

Ставка на “моделі світу”

Дослідник відверто називає сучасні рушії ШІ “тупими” і пропонує альтернативу — так звані моделі світу. Вони, на відміну від LLM, мають вчитися розуміння причинно-наслідкових зв’язків, планування дій та взаємодії з фізичною реальністю. В цій стратегії лежить архітектура, названа Joint Embedding Predictive Architecture (JEPA).

Звичайні моделі часто намагаються роздивитися кожен піксель у відео, що потребує величезних обчислювальних ресурсів і створює багато “шуму”. JEPA працює інакше — у так званому “латентному просторі”, де модель оперує абстрактними представленнями даних. Інакше кажучи, система не зосереджується на дрібних деталях, а вивчає ключові взаємозв’язки між подіями. Сам Лекун називає такий підхід розвитком “фізичного інтелекту”.

📈 Більше новин про крипто-світ читайте на CryptoTop.info!

“`

No votes yet.
Please wait...

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *