Штучний інтелект стиснув усі рецепти людства: як розшифрувати секрет

Лондонський стартап навчив ШІ на 4,1 мільйоні рецептів сімома мовами — і все це менше за розмір аудіофайлу.

Штучний інтелект стиснув усі рецепти людства: як розшифрувати секрет 2

Створіть обліковий запис, щоб зберегти свої статті.Додати в GoogleДодайте Decrypt як джерело за вибором, щоб бачити більше наших історій у Google.

Коротко

  • KAIKAKU.AI опублікував Epicure — сімейство з трьох моделей ШІ для інгредієнтів, навчених на 4,14 мільйона рецептів різними мовами.
  • Модель не зберігає рецепти — вона зберігає знання, отримані з них, дозволяючи користувачам навігувати кулінарними знаннями математично.
  • Три варіанти — Cooc, Chem і Core — розташовуються в різних точках спектру “контекст рецепту проти хімії смаку”, кожен з яких відповідає на дещо інше кулінарне питання з одного файлу розміром 2 МБ.

Йозеф Чен стверджує, що стиснув все людське кулінарне мистецтво до двох мегабайтів. Це смілива заява. І вона відповідає дійсності.

Чен, співзасновник і генеральний директор лондонського стартапу в галузі харчових технологій KAIKAKU.AI, опублікував цього тижня на arXiv статтю разом із дослідником Якубом Радзіковським, представляючи Epicure — три моделі ШІ, навчені на 4,14 мільйона рецептів, зібраних з 11 наборів даних сімома мовами. Результат: карта з 1790 інгредієнтів, кожен з яких описаний 300 числами, що вміщується в ліміт вашого електронного листа із запасом.

"4,1 мільйона рецептів. 7 мов. 1790 інгредієнтів. 300 вимірів", — написав Чен у X. "Усе людське кулінарне мистецтво стиснуто до 2 мегабайтів".

Це не зберігає рецепти

Перш ніж ви уявите USB-накопичувач обсягом два мегабайти, забитий інструкціями зі смаження, модель не зберігає жодного рецепту. Два мегабайти — це радше координатна таблиця, ніж кулінарна книга.

Уявіть це як карту. Кожен інгредієнт отримує точне місцезнаходження, засноване на його поведінці в мільйонах реальних страв у всьому світі. Математика проста: 1790 інгредієнтів × 300 чисел на інгредієнт × 4 байти кожен ≈ 2,05 мегабайта. Ці числа кодують, які інгредієнти з’являються разом, які мають спільні ароматичні сполуки, і які належать до однієї кулінарної традиції. Як тільки модель вивчає все це з рецептів, самі рецепти можуть бути видалені. Знання живуть у координатах.

Це, по суті, той самий трюк, який word2vec зробив з мовою в 2013 році, коли дослідники Google показали, що можна виконувати арифметичні операції зі значенням. Epicure робить це для їжі. Візьміть яловичину, направте її в бік Америки, і ви отримаєте хліб, салат, можливо, пиво. Направте її в бік Південно-Східної Азії, і модель перестане думати про бургери та гриль, а почне думати про соєвий соус, імбир і кунжутну олію.

Це відбувається через те, що в статті називається оператором керування SLERP-обертання. Візьміть вихідний інгредієнт — курку — і математично оберніть його в напрямку кухні. Під кутом 30 градусів ви почнете бачити техассько-мексиканську територію. Під кутом 60 градусів курка та яловичина збігаються в одній мексиканській коморі: кукурудзяна тортилья, сальса, монтерей джек, перець поблано. Кут — це регулятор між "залишатися біля цього інгредієнта" і "приземлитися десь новеньке".

Epicure існує в трьох версіях, і вибір правильної залежить від того, що ви насправді запитуєте. Cooc навчається на співвиникненні рецептів — що з’являється разом у реальних стравах. Chem навчається на хімії смаку — які інгредієнти мають спільні ароматичні сполуки з бази даних хімічних речовин FlavorDB. Core є сумішшю попередніх двох.

Запитайте Cooc, що поєднується з шоколадом, і ви можете отримати компаньйонів з десертної комори: какао-порошок, ваніль, мигдаль. Запитайте Chem, і ви отримаєте аналогічні за хімією смаку інгредієнти: іриска, помадка, ганаш.

Той самий інгредієнт, інше запитання. Шеф-кухар, який шукає заміну, має інші потреби, ніж шеф-кухар, який складає карту сумісності смаків.

Чому це не ChatGPT для їжі

Epicure не має загальних знань, не генерує мову і не може вигадати інгредієнт, якого ніколи не бачив. Він знає 1790 інгредієнтів. Це весь світ, наскільки це стосується цієї моделі. Те, що вона втрачає в широті, вона здобуває в надійності — на відміну від чат-ботів з рецептами, які впевнено запропонують отруту як кулінарний інгредієнт, якщо ви натиснете не ту кнопку.

Попереднім передовим досягненням у цій галузі був FlavorGraph, модель 2021 року, яка поєднувала хімічні дані з англомовним набором даних Recipe1M+. Epicure включає багатомовний корпус, що в чотири рази більший, і очищає словниковий запас для ефективності.

Практичне застосування легко уявити. Шеф-кухар запитує, як виглядає східноазіатський еквівалент середземноморського інгредієнта. Розробник харчових продуктів запитує, яка мінімально оброблена заміна потрапляє в ту саму смакову зону, що й добавка. Додатку з рецептами потрібна послідовна заміна, коли інгредієнта немає на кухні. Останній випадок — це прогалина, де спеціалізовані малі моделі тихо перевершують великі універсальні.

Стаття Epicure є науковим релізом. Навчені моделі доступні на Hugging Face, а інтерактивна карта інгредієнтів публічно доступна за адресою epicure.kaikaku.ai. Вони навіть випустили MCP для ваших агентів. Повний код для навчання на даний момент не випускається.

Погляд Crypto Top: Мініатюризація та оптимізація ШІ-моделей, подібних до Epicure, відкриває нові можливості для їх інтеграції в децентралізовані обчислювальні мережі, що потенційно підвищить утилітарність токенів, пов’язаних з цими мережами, як-от FET чи TAO.

Джерело: decrypt.co

No votes yet.
Please wait...

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *