Qwen-Image-Edit: Первый Взгляд

Открытая модель Qwen-Image-Edit вышла и уже работает в ComfyUI. Она умеет: делать новые ракурсы из одного фото, добавлять/удалять объекты, менять фон, точно править текст на изображении (английский и китайский) со сохранением шрифта и стиля. Есть ускоряющая Lightning LoRA для генерации за 4 шага.


Что нового

  • Два тракта редактирования: семантика (через Qwen2.5-VL) + внешний вид (через VAE). Это даёт гибкость: можно менять “смысл” сцены или косметику, не руша остального.
  • Новые ракурсы: поворот объектов до 90–180° и “вид спереди/сзади” из одного исходника. Полезно для генерации датасетов персонажей.
  • Текст на картинке: добавление/исправление/перевод с сохранением шрифтов— редкая сильная сторона среди открытых моделей.
  • Открытая лицензия: удобно для коммерческих проектов и доработок сообществом.

Насколько “реальны” новые ракурсы? Модель достраивает невидимые части по знанию о мире. Точность фотопруфа не гарантируется (это не 3D-скан), но визуально результаты часто убедительны. Для симметричных/знакомых объектов — особенно хорошо.


Перенос объекта между фото?

  • Прямого режима “две картинки совместить в одну” нет. Зато работает перенос через текст: загрузить фото B и в промпте описать объект из фото A — модель дорисует его в B, подгоняя свет/перспективу.
  • Для точного совмещения: вырезать объект из A вручную, наложить на B и прогнать через Qwen-Image-Edit с инструкцией “свести, сделать реалистично”. Модель аккуратно “склеит” цвета/тени. Такой вариант вполне пригоден.

Промпт-инжиниринг

  • Пишите конкретно, простыми предложениями: что менять и что не менять (“фон заменить, лицо/цветок не трогать”).
  • Добавляйте ограничения: “do not change style / lighting”. Это снижает нежелательные сдвиги стиля.
  • Используйте negative prompt для явных “нельзя”.
  • Сложные правки — по шагам: фон → одежда → мелкие детали, с повторным прогоном результата.

Требования к железу

  • Модель крупная; комфортно на GPU ≥ 8 ГБ VRAM и с запасом ОЗУ.
  • FP8-весы уменьшают объём и позволяют запуск на массовых картах.
  • Lightning LoRA сильно ускоряет предпросмотр (секунды вместо десятков секунд).

Где это полезно прямо сейчас

  • Контент/дизайн: менять надписи/логотипы, локализация постеров.
  • Каталоги/товары: быстрые ракурсы без 3D.
  • Ретушь: замена фона, убирание объектов, правка деталей одежды/материалов.
  • Аватары/маскоты: вариации персонажа под разные задачи.

Вывод

Qwen-Image-Edit — мощный и уже “готовый к делу” редактор изображений в ComfyUI: новые ракурсы, объектные правки и, главное, точный текст на картинке. Если нужен продакшн-уровень редактирования и свобода лицензии — это сейчас один из лучших открытых вариантов. Для быстроты — используйте Lightning LoRA и ступенчатые правки.


Дополнителные примеры