DeepSeek випустили оновлення ІІ-моделі V3
Китайський ІІ-стартап DeepSeek випустив велике оновлення для своєї мовної моделі V3. DeepSeek-V3-0324 доступна на платформі Hugging Face.
Нова версія нейромережі покращена в галузях міркувань, програмування та листи. Вона обходить попередника та рішення від конкуруючих компаній у низці бенчмарків.
DeepSeek стала помітним гравцем на ринку штучного інтелекту у січні. Тоді компанія випустила орієнтовану на міркування модель з відкритим вихідним кодом DeepSeek-R1, яка розроблена на значно менший бюджет.
V3 з 671 млрд. параметрів з'явилася в грудні 2024 року.
CEO китайського стартапу 01.AI Лі Кай-фу вважає, що Китай скоротив розрив із США у розвитку штучного інтелекту до трьох місяців, оскільки компанії на кшталт DeepSeek навчилися використовувати чіпи та застосовувати алгоритми більш ефективно.
Країна вже стала лідером у галузі розробки програмного забезпечення для інфраструктури, додав він.
«Раніше, я думаю, розрив становив від шести до дев'яти місяців, і ми відставали у всьому. А зараз я думаю, що, можливо, на три місяці відстаємо в деяких основних технологіях, а в інших специфічних галузях випереджаємо», – сказала Кайфу.
Санкції США створювали короткострокові проблеми, але також змушували китайські компанії впроваджувати інновації, наголосив експерт.
Нагадаємо, після різкого зльоту популярності ІІ-моделей DeepSeek на компанію звернули увагу влада Китаю. Співробітники працюють у нових, жорсткіших умовах.
Раніше OpenAI рекомендувала уряду США заборонити рішення китайського конкурента, оскільки проект «субсидується державою» та «контролюється ним».
Источник: cryptocurrency.tech