OpenAI выпустила ChatGPT Images 2.0 с генерацией текста и «мышлением»

22 апреля 2026 года OpenAI выпустила ChatGPT Images 2.0, доступную под идентификатором модели gpt-image-2. Релиз знаменует отход от диффузионной архитектуры предыдущих генераторов изображений. Новая модель включает то, что OpenAI называет «возможностями мышления»: прежде чем сгенерировать изображение, она выполняет поиск в интернете, создаёт несколько вариантов и верифицирует результат на соответствие исходному промпту. Выходной результат проверяется до того, как передаётся пользователю.

Наиболее значимое улучшение касается точности воспроизведения текста. Предыдущие генераторы изображений создавали меню и вывески с ошибками в словах. Images 2.0 воспроизводит печатный текст, неотличимый от профессиональной вёрстки. Модель также обрабатывает нелатинские письменности — японскую, корейскую, хинди и бенгальскую, — которые прежде воспроизводились ненадёжно в большинстве генераторов изображений.

Для продуктовых команд это означает, что генерация маркетинговых материалов, макетов UI с читаемым текстом и многоформатных визуальных элементов теперь даёт пригодный результат с первой попытки, не требуя ручной правки или повторного прохода с дизайнером. Модель рендерит мелкий текст, UI-элементы и иконографию в разрешении до 2K. Многопанельные форматы — например, инструкции или объяснения в комиксном стиле — обрабатываются в рамках одного промпта.

Доступ открылся для всех пользователей ChatGPT и Codex 22 апреля. Расширенные возможности доступны для платных подписчиков. Модель также доступна через API по тарификации за использование.

Для продакт-менеджеров, работающих с контентно-нагруженными продуктами, e-commerce или чем угодно, что предполагает регулярную генерацию визуальных материалов, это меняет предположения о стоимости и скорости соответствующей части воркфлоу. Ограничивающим фактором теперь является не воспроизведение читаемого текста — а точность промпта.