介绍
基于 Qwen 大模型的专业 AI 图像编辑平台
什么是 Qwen Image Edit?
Qwen Image Edit 是基于阿里云通义千问大模型的专业AI图像编辑平台。基于200亿参数的Qwen-Image模型构建,成功将Qwen-Image独特的文本渲染能力扩展到图像编辑任务,实现精确的文本编辑和高级图像处理。
核心功能
语义和外观编辑
Qwen-Image-Edit 支持两种编辑模式:
- 低级视觉外观编辑:添加、删除或修改元素,同时保持图像其他区域完全不变
- 高级视觉语义编辑:IP创作、物体旋转和风格转换,允许整体像素变化的同时保持语义一致性
精确文本编辑
支持中英文双语文本编辑,可以直接在图像中添加、删除和修改文本,同时保持原有的字体、大小和样式。
高级图像操作
从逼真场景到印象派绘画,从动漫美学到极简设计,模型能够流畅适应创意提示。高级操作包括:
- 风格转换
- 物体插入或移除
- 细节增强
- 图像内文本编辑
- 人体姿态调整
工作原理
Qwen-Image-Edit 同时将输入图像送入:
- Qwen2.5-VL 进行视觉语义控制
- VAE编码器 进行视觉外观控制
这种双重方法实现了语义和外观编辑的能力,让专业级编辑触手可及。