腾讯混元世界模型1.5(HY WorldPlay)
Search documents
腾讯研究院AI速递 20251218
腾讯研究院· 2025-12-17 16:01
生成式AI 一、OpenAI推出全新ChatGPT Images,sam露腹肌搞宣传 1. OpenAI发布全新图像生成模型驱动的ChatGPT Images,图像生成速度提升4倍,实现精准编辑并保持细节完好, Sam Altman亲自下场"辣眼睛"宣传; 2. 该模型支持添加、删减、组合、融合等多种编辑类型,文本渲染能力增强可处理更密集更小的文字,并可将日常照 片转换成电影海报等创意风格; 3. 新版Images功能向所有ChatGPT用户推出,API以GPT Image 1.5形式提供,价格比GPT Image 1降低20%,内 置数十种预设滤镜和提示词。 https://mp.weixin.qq.com/s/ORFy20qnLXeIu4FKHlHf0g 二、3D分割还不够,Meta开源SAM Audio分割一切声音 1. Meta开源音频分割模型SAM Audio,支持文本、视觉和业内首创的时间跨度提示三种方式,可从复杂音频混合中 分离任意声音; 四、腾讯混元世界模型1.5发布,国内首个开放实时体验 1. 腾讯混元世界模型1.5(HY WorldPlay)正式发布并开源,支持文本或图片输入创建实时交互的 ...