Z.ai GLM-5.2: Новий рубеж у ШІ-обчисленнях на базі Huawei

Створіть обліковий запис, щоб зберегти статті.Додати в GoogleДодайте Decrypt як джерело за вибором, щоб бачити більше наших історій у Google.
Коротко
- GLM-5.2 відстає від Claude Opus 4.8 лише на 1% у тесті FrontierSWE, що оцінює автономні інженерні проєкти тривалістю до кількох годин, при цьому перевершуючи GPT-5.5 у тому ж тесті. Модель поширюється під ліцензією MIT без регіональних обмежень.
- Модель була створена повністю на чипах Huawei Ascend, без використання обладнання NVIDIA.
- Unsloth AI вже випустила 2-бітні квантизовані версії GGUF, які зменшують розмір моделі з 1.51 ТБ до 238 ГБ. Вам все ще знадобиться 256 ГБ оперативної пам’яті або відеопам’яті, але за таких умов ви зможете її запустити.
Z.ai випустила GLM-5.2 16 червня, обіцяючи найвищу продуктивність та перевершуючи свою вже передову модель GLM 5.1.
Пекінська лабораторія, яка з січня 2025 року перебуває в американському “списку компаній”, схоже, отримує вигоду від зростаючого занепокоєння щодо підходу Америки до ШІ. Протягом останнього тижня заборона на Anthropic Fable та випуск цієї нової моделі допомогли збільшити акції zAI на 90%, довівши їх до нового історичного максимуму.

GLM 5.2 має цифри, що підтверджують ажіотаж.
У тесті FrontierSWE, який оцінює здатність ШІ-агента виконувати відкриті технічні проєкти, що вимірюються годинами, охоплюючи оптимізацію систем, масштабне створення коду та прикладні дослідження машинного навчання (оцінюється за показником домінування), GLM-5.2 набрав 74.4 бали проти 75.1 у Claude Opus 4.8. Він обійшов GPT-5.5 з його 72.6 балами. У тесті SWE-bench Pro, який оцінює автономне вирішення реальних проблем GitHub (оцінюється за показником успішності), GLM-5.2 набрав 62.1 бали проти 58.6 у GPT-5.5, значно випередивши свого попередника GLM-5.1 (58.4 бали).
Такий стрибок у якості робить його найкращою моделлю з відкритим вихідним кодом в індексі Artificial Analysis Intelligence Index, який агрегує результати 9 різних показників для оцінки загальної якості моделі ШІ. Бенчмарки OpenRouter ставлять її в один ряд із нині забороненою моделлю Claude Fable 5.

Апаратне забезпечення, використане для досягнення цього результату, є ще однією цікавою частиною історії. GLM-5.2 тренувалася на чипах Huawei Ascend — жодного американського обладнання в процесі. Емад Мостак, засновник Stability AI, оцінив загальні витрати на навчання приблизно у 25 мільйонів доларів, 80% з яких — на постобробку, що зробило б її надзвичайно дешевою порівняно з аналогами.
Як Decrypt повідомляв на початку року, Z.ai вже тренувала моделі для генерації зображень на серверах Huawei Ascend без жодного американського чіпа. GLM-5.2 розширює цю інфраструктуру: це модель “суміші експертів” (mixture-of-experts) з 744 мільярдами параметрів і справжнім контекстним вікном на 1 мільйон токенів (у п’ять разів більше, ніж 200 тис. у GLM-5.1) та ліцензією MIT, що означає, що жодні державні директиви не зможуть вимкнути доступ.
Токени — це частини тексту, які модель може читати та генерувати, тоді як параметри — це кількість внутрішніх налаштувань і значень, які визначають, як модель обробляє інформацію та генерує відповіді.
Для кого це і скільки коштує
Для розробників контекстне вікно є операційним зрушенням. Навігація по всьому репозиторію, рефакторинг багатьох файлів та довгі конвеєри роботи агентів, які раніше вимагали розбиття на частини, тепер стають робочими процесами з одним викликом. Вартість API становить 1.40 долара за мільйон вхідних токенів та 4.40 долара за мільйон вихідних — порівняйте з 5 доларами за вхідні та 25 доларами за вихідні у Claude Opus 4.8. План “Coding Plan” коштує приблизно від 18 доларів на місяць і працює безпосередньо в Claude Code, Cline, Kilo Code та більшості популярних агентних середовищ.
Технічно можливе й локальне розгортання. Unsloth AI випустила 2-бітні квантизовані версії GGUF, які стискають модель з 1.51 ТБ до 238 ГБ, зберігаючи приблизно 82% точності.
Не надто захоплюйтесь. Це все ще вимагає 256 ГБ об’єднаної пам’яті або відповідної комбінації RAM/VRAM — максимум M4 Ultra Mac Studio або робоча станція з відеокартою середнього класу та 256 ГБ системної оперативної пам’яті з вивантаженням суміші експертів. Це все ще великі гроші, але принаймні щось, що ви можете придбати і запустити у себе вдома, якщо дійсно цього бажаєте.
Ми провели швидкий тест, попросивши GLM-5.2 створити нашу стандартну гру, що поєднує механіку набору тексту зі стрілялкою. Інтерфейс не був найпривабливішим — інші моделі генерували більш відполіровані інтерфейси, але ігровий досвід був найрізноманітнішим: різні сценарії протягом хвиль, типи ворогів, що змінювалися, боси, що з’являлися пізніше в грі.
Вона згенерувала різноманітніші ігрові стани, ніж будь-що інше, що ми тестували для того самого завдання в режимі “zero shot”.

Якщо ви хочете пограти, гра доступна в нашому профілі Itch.io.
Така варіативність вказує на те, де GLM-5.2 має найбільший економічний сенс. Для робочих процесів з множинними викликами та агентних конвеєрів, де різноманітність виведення важливіша за відполірованість, математика за цінами відкритого коду важко оскаржується. Для найскладніших тривалих завдань — SWE-Marathon, де модель набрала 13.0 проти 26.0 у Opus 4.8 — розрив із закритими моделями все ще реальний і становить 13 пунктів.
Ваги моделі з відкритим вихідним кодом доступні на HuggingFace під ліцензією MIT. Квантизовані ваги також доступні на HuggingFace. Підписники GLM Coding Plan можуть переключитися зараз, використовуючи рядок моделі GLM-5.2, а також модель доступна для безкоштовного тестування на z.AI з деякими обмеженнями використання.
Погляд Crypto Top: Інтеграція передових ШІ-моделей, як GLM-5.2, на децентралізовані обчислювальні платформи може революціонізувати ринок, знизивши бар’єр входу для розробки ШІ-додатків і підвищивши корисність токенів, що забезпечують доступ до цих ресурсів.
Джерело: decrypt.co
