Qwen-Image-Edit: Первый Взгляд

Открытая модель Qwen-Image-Edit вышла и уже работает в ComfyUI. Она умеет: делать новые ракурсы из одного фото, добавлять/удалять объекты, менять фон, точно править текст на изображении (английский и китайский) со сохранением шрифта и стиля. Есть ускоряющая Lightning LoRA для генерации за 4 шага.

Что нового

Два тракта редактирования: семантика (через Qwen2.5-VL) + внешний вид (через VAE). Это даёт гибкость: можно менять “смысл” сцены или косметику, не руша остального.
Новые ракурсы: поворот объектов до 90–180° и “вид спереди/сзади” из одного исходника. Полезно для генерации датасетов персонажей.
Текст на картинке: добавление/исправление/перевод с сохранением шрифтов— редкая сильная сторона среди открытых моделей.
Открытая лицензия: удобно для коммерческих проектов и доработок сообществом.

Насколько “реальны” новые ракурсы? Модель достраивает невидимые части по знанию о мире. Точность фотопруфа не гарантируется (это не 3D-скан), но визуально результаты часто убедительны. Для симметричных/знакомых объектов — особенно хорошо.

Перенос объекта между фото?

Прямого режима “две картинки совместить в одну” нет. Зато работает перенос через текст: загрузить фото B и в промпте описать объект из фото A — модель дорисует его в B, подгоняя свет/перспективу.
Для точного совмещения: вырезать объект из A вручную, наложить на B и прогнать через Qwen-Image-Edit с инструкцией “свести, сделать реалистично”. Модель аккуратно “склеит” цвета/тени. Такой вариант вполне пригоден.

Промпт-инжиниринг

Пишите конкретно, простыми предложениями: что менять и что не менять (“фон заменить, лицо/цветок не трогать”).
Добавляйте ограничения: “do not change style / lighting”. Это снижает нежелательные сдвиги стиля.
Используйте negative prompt для явных “нельзя”.
Сложные правки — по шагам: фон → одежда → мелкие детали, с повторным прогоном результата.

Требования к железу

Модель крупная; комфортно на GPU ≥ 8 ГБ VRAM и с запасом ОЗУ.
FP8-весы уменьшают объём и позволяют запуск на массовых картах.
Lightning LoRA сильно ускоряет предпросмотр (секунды вместо десятков секунд).

Где это полезно прямо сейчас

Контент/дизайн: менять надписи/логотипы, локализация постеров.
Каталоги/товары: быстрые ракурсы без 3D.
Ретушь: замена фона, убирание объектов, правка деталей одежды/материалов.
Аватары/маскоты: вариации персонажа под разные задачи.

Вывод

Qwen-Image-Edit — мощный и уже “готовый к делу” редактор изображений в ComfyUI: новые ракурсы, объектные правки и, главное, точный текст на картинке. Если нужен продакшн-уровень редактирования и свобода лицензии — это сейчас один из лучших открытых вариантов. Для быстроты — используйте Lightning LoRA и ступенчатые правки.