DeepSeek випустили оновлення ІІ-моделі V3

Китайський ІІ-стартап DeepSeek випустив велике оновлення для своєї мовної моделі V3. DeepSeek-V3-0324 доступна на платформі Hugging Face.

Нова версія нейромережі покращена в галузях міркувань, програмування та листи. Вона обходить попередника та рішення від конкуруючих компаній у низці бенчмарків.

DeepSeek стала помітним гравцем на ринку штучного інтелекту у січні. Тоді компанія випустила орієнтовану на міркування модель з відкритим вихідним кодом DeepSeek-R1, яка розроблена на значно менший бюджет.

V3 з 671 млрд. параметрів з'явилася в грудні 2024 року.

CEO китайського стартапу 01.AI Лі Кай-фу вважає, що Китай скоротив розрив із США у розвитку штучного інтелекту до трьох місяців, оскільки компанії на кшталт DeepSeek навчилися використовувати чіпи та застосовувати алгоритми більш ефективно.

Країна вже стала лідером у галузі розробки програмного забезпечення для інфраструктури, додав він.

«Раніше, я думаю, розрив становив від шести до дев'яти місяців, і ми відставали у всьому. А зараз я думаю, що, можливо, на три місяці відстаємо в деяких основних технологіях, а в інших специфічних галузях випереджаємо», – сказала Кайфу.

Санкції США створювали короткострокові проблеми, але також змушували китайські компанії впроваджувати інновації, наголосив експерт.

Нагадаємо, після різкого зльоту популярності ІІ-моделей DeepSeek на компанію звернули увагу влада Китаю. Співробітники працюють у нових, жорсткіших умовах.

Раніше OpenAI рекомендувала уряду США заборонити рішення китайського конкурента, оскільки проект «субсидується державою» та «контролюється ним».

Источник: cryptocurrency.tech

No votes yet.

Please wait...