Workflow
腾讯开源混元图像2.1!原生2K分辨率生图,千字长文本秒懂
TENCENTTENCENT(HK:00700) 量子位·2025-09-12 08:46

鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI AI生图再进化!图像分辨率直接卷到 2K 。 腾讯开源 混元图像2.1 (HunyuanImage2.1) ,画质直接拉满的同时,还能读懂千字长文本,甚至中英文混搭渲染。 或者搞个美洲驼的概念图,也是轻轻松松~ 新一代模型在技术上全面升级,不仅显著提升图文语义一致性和跨场景泛化能力,还能够精细控制场景、角色姿态甚至多物体描述,达成开源 生图模型中的SOTA。 模型开源之后,在Hugging Face趋势榜上一路飙升,目前已拿下第一名的宝座。 话不多说,先来看几个网友试玩感受一下。 首先康康真实场景下的表现,细腻的手部和脸部纹理,处理细节过关 海报制作上,文本渲染也相当干净。 还有每次必不可少的动漫风环节:魔女宅急便 (圆润猪咪版) 可以说,混元图像2.1更懂语义、更擅图文、更多风格、更高清画质…… 所以咱们这不赶紧上手体验一波。 四大亮点 打开官网,操作界面是酱紫的~选择需要生成的图像尺寸和数量,填写prompt (上限2048) ,就能秒获取超高分辨率图像。 我们体验了一下,总结下来这个模型有四大亮点。 亮点1:复杂语义生成能力强 得益于多样化的大规模图 ...