混元与AI生图的“零延迟”时代
以下文章来源于腾讯科技 ,作者晓静 腾讯科技 . 腾讯新闻旗下腾讯科技官方账号,在这里读懂科技! 晓静 腾讯科技特约作者 5月16日,腾讯混元推出Hunyuan Image2.0 (混元图像 2.0 模型) ,基于超高压缩倍率的图像编解码器,全新扩散架构,实现超快的推理速度和超高质量图像生 成,极大降低"AI味"。 当前主流文生图模型的最大问题是生成时间长,即使是业内领先的模型,也需要5-10秒才能生成一张图像。 此外,文生图模型普遍存在结果随机性问题,用户通常需要多次生成才能获得满意的结果。标准的使用流程通常是"输入提示词→等待数秒→查看结果→调整 重试",对于复杂图像,可能需要十余次调整才能得到真正可用的图。 如果能做到"所见即所得",对产业应用而言,意味着降本增效;对个人用户而言,这项技术提供了类似即时设计助手的体验:制作演讲插图、创意宠物照片等 任务都可以快速完成。即时反馈机制能让创意连贯,让想法更流畅地表达。 | GenEval bench | Overall | Single Obj.l | Two Obj. | Counting | Colors | Position | Color Attri ...