Back to Feed
总结
12月31日,阿里通义团队宣布开源发布图像生成模型Qwen-Image-2512,重点提升三项能力:人物质感更真实、自然纹理更细腻、复杂文字渲染更强,可生成时间轴排版、技术图表及多格漫画对话框等内容。官方称其在AI Arena超过1万局用户盲测中位居开源模型第一,并在与多款闭源模型对比时仍具竞争力。模型与示例已在GitHub提供下载与使用。
正文
IT之家 12 月 31 日消息,阿里通义大模型今日开源发布 Qwen-Image-2512,聚焦于三大核心能力的飞跃式提升: 更真实的人物质感、更细腻的自然纹理、更复杂的文字渲染 ,让生成的图像无限接近真实世界。 更真实的人物质感 :告别塑料脸、模糊五官。2512 能精准刻画皮肤纹理、发丝走向、表情神态,还能理解"微微前倾"这类语义细节。 更细腻的自然纹理 :水流、苔藓、金毛犬的绒毛、盘羊的粗硬皮毛......2512 对自然与生物细节的刻画更细腻。 更复杂的文字渲染 :2512 再进化,不仅能排版时间轴、呈现技术图表、还能生成带多格漫画 + 对话框的健康科普海报。 不止于能力增强,模型整体表现也实现突破:在 AI Arena 超过 1 万局的用户盲测 中,数据显示 Qwen-Image-2512 在开源模型中表现最优,并在与多款闭源模型的对比中依然展现出显著竞争力。 Qwen-Image-2512 官方生成示例如下: Qwen-Image-2512 已全面开源,IT之家附开源地址如下: https://github.com/QwenLM/Qwen-Image
发布时间: