2026-02-21 10:54:34

通义Qwen-Image-2512开源:人物更真、纹理更细、文字更强

摘要
12月31日,阿里通义实验室正式开源发布全新图像生成模型 Qwen-Image-2512。此次更新聚焦于三项关键能力的全面提升:人物表现更加真实、

12月31日,阿里通义实验室正式开源发布全新图像生成模型 Qwen-Image-2512。此次更新聚焦于三项关键能力的全面提升:人物表现更加真实、自然纹理刻画更为精细、文字内容渲染能力显著增强,进一步推动生成图像向真实世界逼近。

在人物生成方面,新模型彻底摆脱了以往常见的“塑料感”和五官模糊问题。Qwen-Image-2512 能够精准还原皮肤的细微质感、发丝的生长方向以及面部表情的情绪变化,甚至可理解如“身体微微前倾”等具有语义深度的描述指令,实现更自然的人物呈现。

在自然场景的细节处理上,该模型展现出更强的感知与表达能力。无论是流动的水体、潮湿表面的苔藓,还是金毛犬柔软的绒毛与盘羊粗粝的皮毛,均能以高度逼真的方式呈现,极大提升了画面的真实度与沉浸感。

文字相关内容的生成亦取得重要突破。2512 版本已支持复杂排版任务,能够生成包含时间轴结构、技术图表的信息图,并可构建多格漫画形式的科普内容,配合对话框实现图文并茂的视觉传达,适用于更多实际应用场景。

此次升级不仅体现在功能层面,整体性能同样实现跨越。根据 AI Arena 平台超过一万轮用户盲测结果统计,Qwen-Image-2512 在众多开源模型中表现领先,且在与多个闭源商业模型的横向对比中仍具备明显竞争力。

目前,该模型已全面开放开源,相关代码及使用文档已在指定平台公开。

科技趋势
时事资讯
回顶部