介绍

基于 Qwen 大模型的专业 AI 图像编辑平台

什么是 Qwen Image Edit?

Qwen Image Edit 是基于阿里云通义千问大模型的专业AI图像编辑平台。基于200亿参数的Qwen-Image模型构建,成功将Qwen-Image独特的文本渲染能力扩展到图像编辑任务,实现精确的文本编辑和高级图像处理。

核心功能

语义和外观编辑

Qwen-Image-Edit 支持两种编辑模式:

  • 低级视觉外观编辑:添加、删除或修改元素,同时保持图像其他区域完全不变
  • 高级视觉语义编辑:IP创作、物体旋转和风格转换,允许整体像素变化的同时保持语义一致性

精确文本编辑

支持中英文双语文本编辑,可以直接在图像中添加、删除和修改文本,同时保持原有的字体、大小和样式。

高级图像操作

从逼真场景到印象派绘画,从动漫美学到极简设计,模型能够流畅适应创意提示。高级操作包括:

  • 风格转换
  • 物体插入或移除
  • 细节增强
  • 图像内文本编辑
  • 人体姿态调整

工作原理

Qwen-Image-Edit 同时将输入图像送入:

  1. Qwen2.5-VL 进行视觉语义控制
  2. VAE编码器 进行视觉外观控制

这种双重方法实现了语义和外观编辑的能力,让专业级编辑触手可及。

参考资料