Открытая модель Qwen-Image-Edit вышла и уже работает в ComfyUI. Она умеет: делать новые ракурсы из одного фото, добавлять/удалять объекты, менять фон, точно править текст на изображении (английский и китайский) со сохранением шрифта и стиля. Есть ускоряющая Lightning LoRA для генерации за 4 шага.
Что нового
- Два тракта редактирования: семантика (через Qwen2.5-VL) + внешний вид (через VAE). Это даёт гибкость: можно менять “смысл” сцены или косметику, не руша остального.
- Новые ракурсы: поворот объектов до 90–180° и “вид спереди/сзади” из одного исходника. Полезно для генерации датасетов персонажей.
- Текст на картинке: добавление/исправление/перевод с сохранением шрифтов— редкая сильная сторона среди открытых моделей.
- Открытая лицензия: удобно для коммерческих проектов и доработок сообществом.
Насколько “реальны” новые ракурсы? Модель достраивает невидимые части по знанию о мире. Точность фотопруфа не гарантируется (это не 3D-скан), но визуально результаты часто убедительны. Для симметричных/знакомых объектов — особенно хорошо.
Перенос объекта между фото?
- Прямого режима “две картинки совместить в одну” нет. Зато работает перенос через текст: загрузить фото B и в промпте описать объект из фото A — модель дорисует его в B, подгоняя свет/перспективу.
- Для точного совмещения: вырезать объект из A вручную, наложить на B и прогнать через Qwen-Image-Edit с инструкцией “свести, сделать реалистично”. Модель аккуратно “склеит” цвета/тени. Такой вариант вполне пригоден.
Промпт-инжиниринг
- Пишите конкретно, простыми предложениями: что менять и что не менять (“фон заменить, лицо/цветок не трогать”).
- Добавляйте ограничения: “do not change style / lighting”. Это снижает нежелательные сдвиги стиля.
- Используйте negative prompt для явных “нельзя”.
- Сложные правки — по шагам: фон → одежда → мелкие детали, с повторным прогоном результата.
Требования к железу
- Модель крупная; комфортно на GPU ≥ 8 ГБ VRAM и с запасом ОЗУ.
- FP8-весы уменьшают объём и позволяют запуск на массовых картах.
- Lightning LoRA сильно ускоряет предпросмотр (секунды вместо десятков секунд).
Где это полезно прямо сейчас
- Контент/дизайн: менять надписи/логотипы, локализация постеров.
- Каталоги/товары: быстрые ракурсы без 3D.
- Ретушь: замена фона, убирание объектов, правка деталей одежды/материалов.
- Аватары/маскоты: вариации персонажа под разные задачи.
Вывод
Qwen-Image-Edit — мощный и уже “готовый к делу” редактор изображений в ComfyUI: новые ракурсы, объектные правки и, главное, точный текст на картинке. Если нужен продакшн-уровень редактирования и свобода лицензии — это сейчас один из лучших открытых вариантов. Для быстроты — используйте Lightning LoRA и ступенчатые правки.