
OpenAI представила улучшенный генератор изображений в ChatGPT
Компания OpenAI внедрила в ChatGPT обновленный генератор изображений 4o Image Generation на базе GPT-4o.
Это позволило пользователям не только создавать эстетически привлекательные изображения, но и генерировать более «практичные» визуальные материалы, такие как графики, плакаты и инфографику.
Основные улучшения 4o Image Generation
1. Повышенная точность генерации Обновленная модель работает точнее и лучше понимает контекст запросов. Она способна создавать изображения с высоким уровнем детализации, включая сложные сцены, текстовые элементы и реалистичные текстуры.
2. Доступность для всех пользователей Модель уже доступна во встроенном интерфейсе ChatGPT, включая бесплатных пользователей. Однако, на бесплатном тарифе действует ограничение — до трех изображений в день.
3.Генерация сложных изображений 4o Image Generation может создавать:
- Фотореалистичные изображения людей;
- Комиксы с заранее заданными диалогами;
- Инфографику и научные диаграммы;
- Иллюстрации с детализированными элементами.

Продвинутая обработка визуальной информации
Модель анализирует контекст диалога, учитывает загруженные пользователем изображения и корректно интерпретирует сложные описания. По словам главы исследований OpenAI Габриэля Го, большинство нейросетей путаются при обработке сложных композиций с 5–8 элементами. 4o Image Generation справляется с 15–20 объектами без ошибок.
Ключевые особенности генерации:
- Точная визуализация текста без артефактов;
- Поддержка разных пропорций изображений и цветовых параметров;
- Возможность редактирования ракурса, заднего фона и добавления новых элементов.

Применение 4o Image Generation
OpenAI продемонстрировала возможности новой модели на примерах:
- Создание научных диаграмм для образовательных целей;
- Разработка маркетинговых материалов, включая постеры и рекламные баннеры;
- Генерация изображений с прозрачным фоном для логотипов, стикеров и меню ресторанов.
С внедрением 4o Image Generation пользователи получили доступ к мощному инструменту для визуального контента. Это открывает новые возможности для дизайнеров, маркетологов и создателей цифрового контента.