阿里Qwen-Image炸裂!中文渲染狂超GPT,五折开卷!

2025-08-12人工智能

Image

阿里开源的图像大模型Qwen-Image已正式上线LiblibAI平台。这款通义千问系列中的首个图像生成基础模型,以其强大的复杂文本渲染能力著称。用户现可在该平台体验,并且限时享受算力五折优惠。

Qwen-Image模型参数量高达20B,采用了一种名为MMDiT(多模态扩散Transformer)的全新架构。其中,“MM”代表模型生成图像、文本等多模态内容的能力,“DiT”则表明这是一种扩散Transformer。

该模型主打中文复杂文本渲染与高一致性图像编辑,能够准确地在不同场景中生成不同语种、风格的文字,甚至可以生成毛笔字书法,或是直接生成带有文本和图像的PPT页面。

千问团队在多个公开基准上对Qwen-Image进行了全面的评估,并与全球领先的开源、闭源图像生成模型进行了对比。结果显示,Qwen-Image在通用图像生成测试GenEval、DPG和OneIG-Bench,以及图像编辑测试GEdit、ImgEdit和GSO上,超越了Flux.1、BAGEL等开源模型,以及字节跳动的SeedDream 3.0和OpenAI的GPT Image 1(High),共获得了12项SOTA(最佳表现)。

尤其值得一提的是,在用于文本渲染的LongText-Bench、ChineseWord和TextCraft基准测试中,Qwen-Image展现出了卓越的性能,特别是在中文文本渲染方面,其表现显著优于现有的先进模型,包括SeedDream 3.0和GPT Image 1(High)。

Qwen-Image模型的亮点包括:

  • 中英文文字排版一体化生成,可控字体/位置/构图,告别复杂内容贴字烦恼。
  • 支持毛笔书法、图中文字融合、PPT页面直接生成等多种功能。
  • 能够胜任从写实到插画,从KV到PPT,从商品图到社媒封面等多种场景需求。
  • 支持图像编辑功能,包括改字、换图、插图、微调细节等。

在一个包含5000条提示、超过20万次匿名对决的AI Arena中,Qwen-Image作为唯一的开源模型成功跻身前三,领先GPT Image 1、FLUX.1 Pro等模型30分以上。在其擅长的中文文字生成场景中,Qwen-Image的单字渲染准确率达到了58.3%。

以下是一些模型实测效果的例子:

  • 中文渲染: 比如,可以生成一位身着淡雅水粉色交领襦裙的年轻女子,背对镜头,手持毛笔在宣纸上书写“哩布哩布”四个汉字的场景。
  • 英文渲染: 可以生成宇宙场景的黑白插画,配以“Cosmic Cruisin’”的文字。
  • 中英混排: 可以生成3D皮克斯动画风格的悬赏传单,标题为“WANTED”,传单中间有一张女人的照片,照片下用华丽的花体字写着 “玛丽·克劳德”。
  • 超长文本: 可以生成陈奕迅演唱会宣传单,包含英文花体字标题“Fear and Dream”以及手写体歌词。
  • 海报设计: 可以生成冰美式咖啡或奶茶促销海报,包含产品特写、促销信息等元素。
  • 字体设计: 可以生成简约现代且富有设计感的字体,例如“在野生活”。
  • 社媒封面: 可以生成美食探店的宣传海报,包含实景创意插画和各种美食元素。

Qwen-Image还支持生成特定尺寸的模板。

Qwen-Image已经正式接入Liblib平台,新媒网了解到,更多功能正在陆续上线中。

当前已上线:WebUI生图体验,用户可以立即使用Qwen-Image模型。

即将支持:

  • ComfyUI 生图:预计本周内上线并开放使用。
  • 独家LoRA:即将上线大量LoRA,提供丰富的垂类风格与编辑能力。
  • 图像编辑模型:即将上线搭配Qwen-Image的编辑模型,支持“图中改字、局部改图、风格指令控制”,增强商用可控性与可编辑性。
  • LoRA 训练支持:支持用户自定义训练风格化LoRA模型,训练链路即将开放。
  • 编辑增强模块:与知名开源实验室合作,推出ControlNet控制组件,并可在生成流程中调用。

为庆祝上线,Liblib平台还推出了Qwen-Image创意生图活动。

活动期间算力五折,低至10算力/张!活动时间:2025年8月5日至2025年8月20日。

奖项设置包括:杰出奖(5名)、人气奖(10名)、参与奖(20名)和分享奖(20名),奖品为LiblibAI会员。

活动标签:#🔥 Qwen · 爆款海报、#💥 Qwen · 上头创意。

新媒网跨境认为,Qwen-Image的开源和上线,将为图像生成领域带来新的活力。

用户可以关注@LiblibAI官方账号,获取模型更新和实用教程。

新媒网(公号: 新媒网跨境发布),是一个专业的跨境电商、游戏、支付、贸易和广告社区平台,为百万跨境人传递最新的海外淘金精准资讯情报。

本文来源:新媒网 https://nmedialink.com/posts/13366.html

评论(0)

暂无评论,快来抢沙发~
阿里开源图像大模型Qwen-Image上线LiblibAI平台,该模型参数量20B,采用MMDiT架构,擅长中文复杂文本渲染与高一致性图像编辑,支持多种功能与场景需求。目前已上线WebUI生图体验,并推出算力五折活动。
发布于 2025-08-12
查看人数 1870
人民币汇率走势
CNY
关注我们
新媒网跨境发布
本站原创内容版权归作者及NMedia共同所有,未经许可,禁止以任何形式转载。