У GPT-4.5 з'явилася функція генерації зображень
25 березня 2025 року компанія OpenAI оголосила про інтеграцію функції генерації зображень в оновлену версію ChatGPT — GPT-4.5. У заяві сказано, що сучасні генеративні моделі можуть створювати фантастичні сцени, але їм важко відтворювати корисні зображення.
Відомо, що GPT-4o генерує фото, орієнтуючись на задані текстові параметри, дотримуючись інструкцій та використовуючи знання як із контексту чату, так і із завантажених зображень.
Також в OpenAI назвали переваги оновленої версії GPT-4.5, а саме:
- відтворення тексту. GPT-4o може поєднувати символи з візуальним контентом;
- багатоетапне покращення зображень. Користувачі можуть змінювати та коригувати зображення у кілька етапів через діалог;
- точне дотримання інструкцій. GPT-4o здатний обробляти запити з детальним описом та розміщувати у зображенні до 10-20 об'єктів, тоді як більшість моделей обмежуються 5-8 елементами;
- навчання у контексті. Модель може аналізувати завантажені зображення та враховувати їх деталі під час створення нових картинок;
- світові знання. GPT-4o інтегрує текстову та візуальну інформацію, що робить його генерацію зображень ще розумнішою та ефективною;
- фотореалістичність та стиль. Модель навчена на зображеннях різних стилів, що дозволяє створювати чи перетворювати зображення максимально переконливо.
У повідомленні сказано, що GPT-4o не ідеальний і має певні обмеження, які OpenAI планує усувати в наступних оновленнях. Крім того, кожне створене зображення міститиме дані, які будуть вказувати на його походження від GPT-4o. Також OpenAI розробила внутрішню систему пошуку, що дозволяє перевіряти, чи зображення було згенеровано цією моделлю.
Відомо, що GPT-4o блокуватиме неприйнятні матеріали та зображення, зокрема, що містять насильство, порнографію або глибокі маніпулятивні фейки.
Крім того, розробники зможуть використовувати генерацію зображень у GPT-4o через API вже найближчими тижнями. Користувачам також доступна гнучка настройка зображень – можна змінювати співвідношення сторін, кольори та прозорість фону. Модель DALL-E можна використовувати і надалі, сказано в заяві.
Источник: cryptocurrency.tech