Google випустила Nano Banana 2: Новий король ШІ-генерації зображень?

Nano Banana 2: Професійні можливості світових знань з блискавичною швидкістю

Google випустила Nano Banana 2: Новий король ШІ-генерації зображень? 8

Створіть обліковий запис, щоб зберігати свої статті.Додати в GoogleДодайте Decrypt як джерело за вибором, щоб бачити більше наших історій у Google.

Коротко

  • Нова модель Google Nano Banana 2 пропонує генерацію зображень професійного рівня зі швидкістю Flash.
  • Пошук у реальному часі дозволяє ШІ-зображенням отримувати фактичну основу.
  • Seedream 5, китайська модель, запущена за кілька днів до цього оголошення, пропонує більшу гнучкість і може стати цікавим конкурентом.

Google останнім часом з вражаючою швидкістю випускає програмне забезпечення зі штучним інтелектом. Лише за останній тиждень ми бачили Gemini 3.1, Lyria та Pali, останній з яких отримав функцію фотозйомки, що стала справжнім хітом. І ось тепер з’явився наступник, мабуть, найбільшого хіта минулого року в галузі генерації зображень.

Nano Banana 2, запущений у четвер, “привносить інтелект Gemini Flash високої швидкості у візуальну генерацію, роблячи можливими швидкі редагування та ітерації”, – заявив Google у своєму офіційному блозі, додавши, що “він робить колись ексклюзивні функції Pro доступними для ширшої аудиторії”.

Ось швидкий розбір. Оригінальна Nano Banana насправді називалася Gemini 2.5 Flash Image і була, по суті, генератором зображень на основі Gemini 2.5 Flash. Потім з’явилася Nano Banana Pro, яка була Gemini 3 Pro Image, і стала золотим стандартом редагування зображень за допомогою ШІ при запуску в листопаді минулого року.

Технічно Nano Banana 2 – це Gemini 3.1 Flash Image. Отже, це не прямий наступник Pro, а скоріше значно покращена версія оригіналу, яка тепер працює на новій основі Gemini 3 Flash. Звучить заплутано? Так.

Суть проста: взяти все, що робило Nano Banana Pro особливим, і змусити це працювати зі швидкістю Flash.

Нова Nano Banana 2 розгортається сьогодні в екосистемі Google. У додатку Gemini вона замінює Nano Banana Pro як стандартну модель у режимах Fast, Thinking і Pro. Передплатники Google AI Pro та Ultra все ще можуть отримати доступ до Nano Banana Pro для спеціалізованих завдань, повторно генеруючи запит через меню з трьома крапками.

Вона також доступна в режимі ШІ Google Пошуку та Lens, через API Gemini в AI Studio та в Vertex AI в попередньому перегляді. Це нова стандартна модель генерації зображень у Flow безкоштовно для всіх користувачів. Google також розширює можливості водяних знаків SynthID та додає підтримку Content Credentials C2PA, щоб надати платформам кращі інструменти для ідентифікації медіа, створених ШІ. Функція перевірки SynthID використовувалася понад 20 мільйонів разів з листопада.

Що нового в Nano Banana 2

Найважливіша новина – це світові знання. Nano Banana 2 може використовувати пошук у реальному часі під час генерації зображень, що означає, що вона може точно відтворювати конкретні об’єкти. Логотипи, визначні місця, недавні події, брендові ідентичності – модель знає, як виглядають речі, тому що може їх знайти, а не просто вгадувати на основі тренувальних даних.

Рендеринг тексту також отримав серйозне оновлення. Тепер ви можете генерувати точний, розбірливий текст у зображеннях, незалежно від того, чи ви задаєте його в запиті, чи дозволяєте моделі самостійно визначати, що написати, на основі контексту. Вона також підтримує переклад у межах зображення, що дозволяє локалізувати рекламну кампанію кількома мовами без необхідності повністю переробляти візуальний контент.

Консистентність об’єктів також виходить на новий рівень. Модель може підтримувати схожість персонажів до п’яти об’єктів і зберігати візуальну точність до 14 об’єктів в одному робочому процесі, згідно з Google. Це величезний крок для тих, хто створює наративи, сторіборди або послідовні брендові активи.

У плані виробництва ви отримуєте все: від 512px до 4K, з нативною підтримкою широкого діапазону співвідношень сторін. Дотримання інструкцій також стало точнішим, ніж у попередніх моделях Flash, що на практиці означає менше запитів, які виконують щось подібне до того, що ви просили, і більше запитів, які роблять точно те, що ви просили.

Міркування також тепер налаштовуються. Розробники можуть встановлювати рівні міркувань від Мінімального (за замовчуванням) до Високого або Динамічного, дозволяючи моделі аналізувати складні запити перед тим, як генерувати зображення. Саме це поєднання швидкості та опціональної ретельності приносить значне підвищення якості.

Google випустила Nano Banana 2: Новий король ШІ-генерації зображень? 9

Тестування моделі

Заяви про швидкість підтверджуються. Ми попросили Nano Banana 2 згенерувати повну хронологію екосистеми Bitcoin, включно з дослідженням та фінальним зображенням. Весь процес зайняв приблизно стільки ж часу, скільки Nano Banana Pro потрібно було лише для завершення хронології Bitcoin. Коли ми продовжили з запитом про хронологію Ethereum, це майже не збільшило час. Це суттєва різниця для тих, хто використовує ітераційні конвеєри або будує в масштабі.

Можливість використання світових знань справді змінює враження від результату. Коли ми запросили хронологію історії криптовалют, модель проаналізувала кілька джерел, вибрала найважливіші події та структурувала зображення навколо них. Це не було узагальнено. Модель робила редакційні рішення. Єдиним реальним недоліком, який ми помітили, був відсутній візуальний зв’язок між кінцем одного розділу та початком іншого. Все інше тримається купи. Nano Banana Pro, навпаки, створила щось більш загально-художнє і не доклала явних зусиль для пошуку чи пріоритезації подій.

Наприклад, ось що згенерувала Nano Banana 2 за запитом “Створити хронологію історії Bitcoin, висвітливши найважливіші події від його створення до сьогодні. Широкоекранний формат, стиль дитячого малюнка” з використанням міркувань.

Google випустила Nano Banana 2: Новий король ШІ-генерації зображень? 10

Для порівняння, ось результат тієї ж генерації за допомогою Nano Banana Pro:

Google випустила Nano Banana 2: Новий король ШІ-генерації зображень? 11

Консистентність персонажів та обробка тексту були найвражаючими частинами наших тестів. Ми попросили модель згенерувати обкладинку журналу, і кожен рядок тексту вийшов точним і чітким. Жодних спотворених символів, жодного розпливчастого шрифту.

Google випустила Nano Banana 2: Новий король ШІ-генерації зображень? 12

Nano Banana Pro також сильна в цьому аспекті, але вона генерує більше збоїв, а її результат обкладинки журналу мав якість 3D-рендерингу, що виглядає синтетично.

Google випустила Nano Banana 2: Новий король ШІ-генерації зображень? 13

Результат Nano Banana 2 виглядає фотореалістично. Вона також показує менше спотворених символів загалом при генерації тексту за власними міркуваннями, а не лише тоді, коли їй явно вказано, що писати.

Однак модель має чітку межу контенту. Ми попросили Nano Banana 2 відредагувати реальне фото та змінити одяг на спідню білизну. Після тривалого циклу міркувань вона відмовила. Це було б очікувано, якби не той факт, що вона відмовила в редагуванні фотографії жінки, але не чоловіка.

Google випустила Nano Banana 2: Новий король ШІ-генерації зображень? 14

Запит на заміну купальника пройшов успішно. Рівень цензури приблизно еквівалентний Nano Banana Pro, що означає, що все, що наближається до відвертого контенту або маніпуляцій реальними людьми в пікантних контекстах, буде заблоковано. Це має більше значення, ніж може здатися, і ми пояснимо чому за мить.

Seedream 5: Nano Banana 2 має конкурента

Ось у чому річ: якщо ви запускаєте флагманську модель зображень наприкінці лютого 2026 року, ByteDance запустила Seedream 5 того ж тижня.

Seedream стала улюбленицею спільноти за останній рік, і не дарма. Вона гнучка, економічно ефективна – близько 0.035 доларів за зображення через API, що становить приблизно третину цін Google, – а її модерація контенту значно більш дозвільна, ніж у Google. Останній пункт забезпечив їй лояльну аудиторію серед творців, яким потрібен більший простір для роботи з реальними людьми або розширення візуальних меж.

Seedream 5 інтегрує пошук у реальному часі в свій конвеєр генерації, покращені міркування, більш надійну консистентність референсів та підтримку до 14 референсних зображень в одному багатоетапному робочому процесі редагування. Вона генерує зображення в 2K і 4K за секунди. Її також можна запускати локально, що Google не дозволяє, і вона доступна в CapCut та Jianying від ByteDance, а також через стандартний API.

Коротко кажучи, і Google, і ByteDance випустили моделі зображень, засновані на веб-пошуку та з покращеними міркуваннями, в один тиждень. Це багато говорить про те, куди рухається вся категорія.

Погляд Crypto Top: Інтеграція передових ШІ-моделей, таких як Nano Banana 2, з децентралізованими обчислювальними мережами може відкрити нові горизонти для масштабування та доступності потужних ШІ-сервісів. Це також може призвести до появи нових токенів, що представляють ресурси або контроль над цими інтегрованими ШІ-системами, підвищуючи їхню корисність в екосистемі Web3.

Джерело: decrypt.co

No votes yet.
Please wait...

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *