Google DeepMind виділяє $1,1 млрд на революційний ШІ без людських даних

Ineffable Intelligence робить ставку на навчання з підкріпленням як шлях до суперінтелекту, а не на великі мовні моделі ШІ.

Google DeepMind виділяє $1,1 млрд на революційний ШІ без людських даних 2

Створіть обліковий запис, щоб зберегти свої статті.Додати в GoogleДодайте Decrypt як джерело за вашим вибором, щоб бачити більше наших історій у Google.

Коротко

  • Девід Сілвер, ветеран DeepMind, залучив 1,1 мільярда доларів для свого нового стартапу Ineffable Intelligence з оцінкою в 5,1 мільярда доларів.
  • Сілвер стверджує, що навчання з підкріпленням, а не великі мовні моделі, є найкращим шляхом до суперінтелекту.
  • Стартап має на меті створити ШІ-“супернавчальників”, які вчаться через симуляції та самоігри.

Девід Сілвер, вчений DeepMind, який стоїть за історичною перемогою AlphaGo над чемпіоном світу з Го Лі Седолем у 2016 році, залучив 1,1 мільярда доларів для запуску стартапу, який робить ставку на те, що наступна ера ШІ не буде заснована на сучасних домінуючих технологіях.

Компанія Сілвера, Ineffable Intelligence, була заснована в січні з оцінкою в 5,1 мільярда доларів. Вона робить ставку на навчання з підкріпленням – метод, за допомогою якого системи ШІ вдосконалюються шляхом проб і помилок. Сілвер стверджує, що цей підхід, а не великі мовні моделі, що домінують у галузі сьогодні, пропонує більш надійний шлях до суперінтелекту.

“Я розглядаю нашу місію як встановлення першого контакту із суперінтелектом”, – сказав Сілвер виданню Wired. “Під суперінтелектом я дійсно маю на увазі щось неймовірне. Він повинен самостійно відкрити нові форми науки, технологій, урядування чи економіки”.

Термін “суперінтелект”, популяризований філософом Ніком Бостромом у його книзі 2014 року “Superintelligence”, позначає ШІ, який перевершує людський інтелект майже в усіх сферах. Натомість штучний загальний інтелект (AGI) описує системи, здатні демонструвати людський рівень міркувань у широкому спектрі завдань.

Сілвер стверджує, що великі мовні моделі мають фундаментальні обмеження, оскільки вони навчаються на даних, створених людьми, замість того, щоб формувати власне розуміння через досвід.

“Людські дані – це свого роду викопне паливо, яке надало дивовижний короткий шлях”, – сказав він. “Ви можете розглядати системи, які навчаються самостійно, як відновлюване паливо – щось, що може вчитися і вчитися, і вчитися, і вчитися вічно, без обмежень”.

Сілвер присвятив значну частину своєї кар’єри просуванню цього аргументу. AlphaGo, який поєднував дані людського навчання з навчанням з підкріпленням та самоіграми, розробив стратегії, які здивували навіть провідних людських гравців, і продемонстрував, як ШІ може перевершити людський прецедент у вузьких сферах.

“Я вважаю, що дуже важливо, щоб існувала елітна лабораторія ШІ, яка повністю зосереджена на цьому підході”, – сказав він Wired. “Щоб це не було просто куточком іншого місця, присвяченого LLM”.

Ineffable Intelligence планує створити те, що Сілвер називає “супернавчальниками” – ШІ-агентами, поміщеними в симуляції, де вони можуть досягати цілей, зазнавати невдач, адаптуватися та вдосконалюватися без обмежень статичного набору людських даних. Сілвер відмовився описувати, як виглядатимуть ці симуляції, але зазначив, що такий підхід дозволить агентам співпрацювати та самостійно розвивати здібності.

Сілвер стверджував, що великі мовні моделі обмежені даними, на яких вони навчаються, і додав, що модель, навчена у світі, де всі вірили, що Земля пласка, ймовірно, дотримувалася б цієї віри, якби не могла перевірити реальність самостійно. Система, яка навчається на досвіді, за його словами, могла б відкрити щось інше.

Ineffable Intelligence не одразу відреагувала на запит Decrypt про коментар.

Погляд Crypto Top: Розробка суперінтелекту за допомогою навчання з підкріпленням може призвести до створення більш автономних ШІ-агентів, інтегрованих у децентралізовані мережі. Це може радикально змінити механізми ціноутворення та корисність токенів, пов’язаних із обчислювальними ресурсами та управлінням ШІ.

Джерело: decrypt.co

No votes yet.
Please wait...

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *