OpenAI представила GPT-Rosalind, свою першу галузеву модель, створену для прискорення процесів відкриття ліків та досліджень у сфері наук про життя. Це значний крок у розвитку спеціалізованих ШІ-рішень, спрямованих на вирішення складних завдань у конкретних наукових дисциплінах.

Названа на честь британської хімічки Розалінд Франклін, чия робота з рентгенівської кристалографії допомогла розкрити структуру ДНК, ця модель покликана оптимізувати наукові робочі процеси. Вона є першою у серії моделей OpenAI для наук про життя, що свідчить про стратегічний фокус компанії на цьому висококонкурентному ринку.
Ключові моменти
- OpenAI представила GPT-Rosalind для прискорення розробки ліків.
- Бенчмарки демонструють значні покращення, але реальний вплив ще обмежений.
- Доступ суворо обмежений через зростання занепокоєння щодо біобезпеки.
Процес виведення ліків на ринок, від виявлення мішені до отримання дозволу регуляторних органів, в середньому триває від 10 до 15 років. Значну частину цього часу займає рутинна робота: аналіз тисяч наукових статей, запити до баз даних, проєктування реагентів та інтерпретація неоднозначних результатів. Саме ці завдання покликана вирішити GPT-Rosalind.
OpenAI стверджує, що модель здатна значно скоротити час, необхідний для виконання цих завдань на ранніх стадіях досліджень. GPT-Rosalind розроблена, щоб допомогти вченим “досліджувати більше можливостей, виявляти зв’язки, які могли б залишитися непоміченими, та швидше формулювати кращі гіпотези”.
Бенчмарки підтверджують амбіції компанії. На BixBench — наборі тестів, побудованому на реальних завданнях біоінформатики — GPT-Rosalind показала коефіцієнт успішності 0.751, що є найкращим результатом серед моделей з опублікованими даними. На LABBench2 вона перевершила попередню модель GPT-5.4 у шести з одинадцяти завдань.
GPT-Rosalind перевершує GPT 5.4 у всіх задачах, пов’язаних з науками про життя, але це високоспеціалізована модель, яка показуватиме нижчі результати в будь-яких інших сферах.

Компанія Dyno Therapeutics співпрацюватиме з OpenAI для тестування та оцінки моделі на основі неопублікованих послідовностей РНК, щоб виключити можливість запам’ятовування даних. Найкращі результати GPT-Rosalind у завданнях прогнозування послідовностей перевищили 95-й процентиль людських експертів, а в завданнях генерації — близько 84-го процентиля.
Джой Цзяо, керівниця відділу наук про життя в OpenAI, обережно оцінює можливості моделі. Вона зазначила, що GPT-Rosalind не є моделлю, здатною самостійно створювати нові методи лікування, але може суттєво прискорити дослідження. “Ми вважаємо, що існує реальна можливість допомогти дослідникам швидше проходити найскладніші та найтриваліші етапи наукового процесу”, — заявила Цзяо.
Екосистема навколо моделі, ймовірно, матиме таке ж значення, як і сама модель. OpenAI також випускає безкоштовний плагін для Codex, призначений для наук про життя, який підключається до понад 50 наукових баз даних та інструментів, включаючи пошук структур білків, аналіз послідовностей, огляд літератури та геномні конвеєри. Корпоративні користувачі з доступом до GPT-Rosalind отримують додатковий рівень для обробки міркувань, тоді як інші користувачі отримують плагін зі стандартними моделями.
OpenAI вже налагодила співпрацю з низкою фармацевтичних та біотехнологічних компаній, зокрема Amgen, Moderna та Thermo Fisher Scientific. Окрім того, компанія проводить дослідницьку співпрацю з Національною лабораторією Лос-Аламоса у сфері дизайну білків та каталізаторів за допомогою ШІ.
“Сфера наук про життя вимагає точності на кожному етапі. Завдання є надзвичайно складними, дані — унікальними, а ставки — надзвичайно високими”, — зазначив Шон Бруїч, старший віце-президент з ШІ та даних у Amgen, в офіційному анонсі.
Доступ до GPT-Rosalind свідомо обмежений. Модель доступна лише для підприємств у США та проходить кваліфікаційну перевірку безпеки. Занепокоєння щодо біобезпеки є реальним: міжнародна коаліція вчених закликала до посилення контролю над біологічними даними, що використовуються для навчання ШІ, через ризик створення патогенів. Обмежене розгортання GPT-Rosalind є прямою відповіддю на ці побоювання. Під час дослідницького попереднього доступу використання моделі не споживатиме наявні API-кредити.
Це не перший крок OpenAI у наукові робочі процеси. Науковий робочий простір Prism, запущений у січні, став першою спробою. GPT-Rosalind є більш потужним та спеціалізованим продовженням, сигналізуючи про те, що галузеві моделі стають серйозним конкурентним напрямком.
Жоден повністю розроблений за допомогою ШІ препарат ще не пройшов фазу 3 клінічних випробувань. Однак, якщо GPT-Rosalind допоможе досліднику розробити кращий експеримент на шість місяців швидше в тисячах лабораторій, кумулятивний ефект на те, що буде відкрито і коли, може кардинально змінити галузь. Саме в цьому полягає реальна теза, і за нею варто уважно спостерігати.
Погляд Crypto Top: Ця спеціалізація ШІ для галузі наук про життя демонструє потенціал для децентралізованих обчислень та ШІ-агентів в управлінні складними науковими процесами, використовуючи блокчейн для безпечного зберігання даних та перевірки результатів. Інтеграція з блокчейном може уможливити створення децентралізованих платформ для досліджень, де вчені зможуть спільно працювати над проєктами, а стимули на основі токенів мотивуватимуть їхній внесок.
Джерело: decrypt.co
