7×24小时邮箱咨询服务

千问最新图像基座模型,正式发布!

时间:2026-02-24 11:42:08    作者:阿里云    来源:阿里云

刚刚,阿里巴巴正式发布新一代图像生成及编辑模型Qwen-Image-2.0。该模型支持1K token的超长文字输入和2K高分辨率,可准确渲染复杂指令。


作为千问大模型的图像生成模型底座,Qwen-Image-2.0集生图和编辑于一体,在AI Arena文生图评测中斩获1029分,位列全球第三。


图片


目前,阿里云百炼上已开通API邀测,开发者也可直接通过Qwen Chat(https://chat.qwen.ai/)免费体验新模型。


// 集图像生成与编辑于一体


Qwen-Image-2.0在Qwen-Image和Qwen-Image-Edit两大模型基础上全新升级,首次将图像生成和编辑统一到一个模型中去,以更轻量的模型架构,实现了生图和改图性能的大幅提升。


图片

根据提供图片(图左)
生成一个九宫格带不同拍照姿势的组图(图右)


性能方面,在AI Arena评测中,Qwen-Image-2.0在图像生成中得分1029,位列第三;在图片编辑中得分1034,仅次于Nano Banana Pro。


图片


// 输入提示词大幅拓展,可实现复杂任务


Qwen-Image-2.0将输入提示词扩展到1K token,可详尽描述任务,实现更专业的文字渲染,轻松拿捏专业PPT、高级海报、多格漫画等复杂图片。


比如以小楷字体几近完全渲染《兰亭集序》数百字的全文配图,以自然语言生成论文格式配图的复杂PPT等,根据超市环境生成现实风格的超市商品海报等。


图片
图片


// 文字渲染更优,生图应用场景更丰富


基于模型架构与性能的全新升级,Qwen-Image-2.0生图质感尤为细腻,小至老人皱纹的褶皱,大到浩然宇宙,模型生成的人物、自然、建筑等常用图片都极其逼真。


其中,在中文汉字渲染方面,Qwen-Image-2.0表现极为突出,不但可以以多种字体准确渲染汉字,而且写得又多又准,效果比 Nano Banana Pro更优。


图片


同时,用户也可上传数张图片进行编辑,生成诸如九宫格多手势自拍、全景式人物图像拆解、多种创意风格造型,以及诗词配图等。


图片

根据提供图片(图左)

生成全景式人物概念拆解(图右)


图片

根据提供图片(图左1)

稳定生成不同创意风格图片(图左起2、3、4)


基于全新的Qwen-Image-2.0模型,用户还可与AI协同创作出更丰富、更实用的图片。


比如一句话生成杭州两日旅游攻略图,写实风格的商品海报,极为逼真的绿色丛林,4x6的多格漫画组图,儿童绘本图等。


图片
图片
图片
图片



TAG标签:
文章详情页广告1
x
在线客服系统