Workflow
量子位
icon
Search documents
量子位招聘 | DeepSeek帮我们改的招聘启事
量子位· 2025-05-16 05:36
DeepSeek 发自 凹非寺 量子位 | 公众号 QbitAI 如果你与我们志同道合,对 AI大模型、具身智能、终端硬件、AI新媒体编辑 感兴趣,我们 正在招聘这些领域的原创作者。 以下岗位均为全职,工作地点:北京中关村。 岗位面向:社招、应届毕业生,所有岗位均可实习——表现出色均可转正 加分项: 加入我们,你可以获得: 乐于探索AI新工具,善用AI新工具; 拥有解读论文的能力,能深入浅出讲解原理; 有写代码能力; 量子位长期读者。 站在AI浪潮之巅 :第一时间接触和了解AI领域最新技术和产品,构建完整的AI认知 体系。 玩转AI新工具 :将各种AI新技术、新工具应用于工作,提升工作效率和创造力。 打造个人影响力 :通过撰写独家原创内容,建立个人知名度,成为AI领域的意见领 袖。 未来同事,你好~ 这是一则 招聘帖 。 量子位 是一个关注AI及前沿科技的新媒体平台,我们着迷于全新技术和趋势带来的改变,并 正致力于帮助更多人第一时间看懂新趋势、新机遇。 AI大模型方向编辑作者 你需要做什么? 我们希望你是: 拓展行业人脉 :与AI领域大咖零距离接触,参与重要科技活动和发布会,拓展行业 视野。 获得专业指导 : ...
做AI眼镜,为什么一定要有定制化大模型 | 对话雷鸟创始人李宏伟
量子位· 2025-05-16 05:36
克雷西 发自 凹非寺 量子位 | 公众号 QbitAI AI眼镜,究竟为什么这么热? 自2023年10月Meta旗下的Ray-Ban Meta智能眼镜发布,标志着智能眼镜终端不再只是极客的玩具,而是 可能成为继智能手机之后,人类与 数字世界交互的下一个核心入口 。 截止目前,国内已有十余家厂商正式发布了AI眼镜产品,还有更多的产品正等待亮相, "百镜大战"的序幕已经拉开 。 这场大战之中,参赛选手属性各不相同,既有互联网厂商,也有做显示出身……不同类型的选手都是以一种怎样的姿态加入的这场战斗? 为了解开这些疑问,量子位与不同属性的AI眼镜从业者进行了对话交谈。 今天的文章是这一系列交流中的第三期,我们对话了 雷鸟创新创始人兼CEO李宏伟先生 。 以下为量子位与李宏伟对话实录,部分内容有删改。 AI眼镜,必须有定制化基座模型 量子位:V3在发布的时候剧透了很多未来要上新的AI功能,V3前不久刚刚完成了一次更新,这次更新有什么亮点?从发布到现在,在技术的 迭代上有没有遇到什么难点? 李宏伟 :最近的一次更新是一个非常重要的更新,我们上线了两个最重要的新功能。 一个是 AI录音 ,它包括了录音、转写、总结、翻译,一 ...
Manus突发上新文生图!告别“抽卡”,Agent+深度思考联合创作
量子位· 2025-05-16 05:36
举个例子,丢给它一张房间照片,让它去宜家官网找家具,生成可视化装修效果。 并且按照演示中的要求,除了画图之外还要在结果当中附上选择的家具链接,结果Manus一通操作都完成了。 拿到照片后,Manus首先根据地板、墙壁等布置分析了房间的风格,形成了一份分析报告。 网友评价,把智能体工作流与图像生成结合到一起,是一个很好的主意。 克雷西 发自 凹非寺 量子位 | 公众号 QbitAI Manus深夜官宣,现在 支持生成图像 了! 图像生成,先动脑再动手 和一般AI绘图工具的"抽卡"模式不同,Manus 能够理解你画图的目的,规划出生成方案后再"动手" 。 我们不妨看一下,Manus在合成效果图时,具体都做了些什么。 之后,Manus通过搜索找到了宜家官网并在沙盒环境当中进行浏览。 一通浏览之后,Manus筛选出了它认为适合放在房间里的家具,并且生成了文字版的介绍。 最后,Manus合成了最终的效果图并按照要求创建了带有商品链接的页面。 再看看Manus展示的其他案例。 Manus被要求基于对饮料市场流行视觉元素的理解,为一个名为"TeaVive"的茶饮料设计一款饮料瓶,并且要求中还提到推广青少年健康。 可以看到, ...
谢赛宁等推出统一多模态模型!替代VAE实现图像理解/生成双SOTA,代码权重数据集全开源
量子位· 2025-05-16 03:39
谢赛宁等团队推出了统一多模态模型 Blip3-o 。 与传统的基于VAE的表征不同,他们提出了一种新方法,使用扩散Transformer来生成语义丰富的CLIP图像特征。这种设计提高了训练效率, 又提升了生成质量。 白交 发自 凹非寺 量子位 | 公众号 QbitAI 统一图像理解和生成,还实现了新SOTA。 在这一背景下,团队又看到了自回归和扩散模型在高质量生成和可扩展性方面有强大的潜力。于是乎,他们开始对统一多模态模型进行了全面 研究,重点关注图像表示、建模目标和训练策略。 统一架构 这些基础上,他们提出了一种新的统一架构。同样包括两部分。 此外,他们还证明, 先进行图像理解训练,再进行图像生成训练 的统一模型顺序预训练策略,具有实用优势,既能保持图像理解能力,又能 培养强大的图像生成能力。 网页端可以免费体验Demo~ 统一多模态模型Blip3-o 在最近的多模态模型研究中,图像理解与生成的统一受到越来越多的关注。尽管研究人员们对图像理解的设计选择进行了广泛的研究,但对图 像生成统一框架的最佳模型架构和训练方法的研究仍然不足。 结果显示,CLIP+Flow Matching在GenEval和DPG-Be ...
鹅厂放大招,混元图像2.0「边说边画」:描述完,图也生成好了
量子位· 2025-05-16 03:39
西风 发自 凹非寺 量子位 | 公众号 QbitAI 刚刚,鹅厂把文生图卷出了新高度—— 发布混元图像2.0模型 (Hunyuan Image 2.0) ,首次实现 毫秒级响应,边说边画,实时生成 ! 用户一边描述,它紧跟着绘制,整个过程那叫一个丝滑。不用等待,专治各种没有耐心。 有些画面描述起来太费劲? 别急,还有 实 时绘画 板 玩法。 用户可以手绘想要的元素,然后辅以文字说明,在另一半画板上它立刻就帮你按照草图绘制出来: 昨天腾讯混元团队发布了一小段预告视频,吊足了大伙儿的胃口。 今天终于正式发布了,真实使用效果到底如何? 量子位已抢先拿到测试资格,一起来看看到底怎么个事儿~ 一手实测实时文生图 实测之前,先来看官方给出的一些小tips: 实时文生图 而且当它把"小女孩"这一主体的模样定下来之后,我们再接着描述对画面做补充,它角色一致性保持得也不错。 各种风格都能驾驭: 打开腾讯混元官网我们就直奔实时文生图,然后随便输入了一句话。 果真是一边打字生图直接跟着一起变换,顺畅~ 模型主打真实感、去AI味,真实场景生图效果会更好 模型是英文数据训练为主,有一些中文不能识别的概念,用英文输入会更好 优先推荐16 ...
量子位招聘 | DeepSeek帮我们改的招聘启事
量子位· 2025-05-16 03:39
DeepSeek 发自 凹非寺 量子位 | 公众号 QbitAI 未来同事,你好~ 这是一则 招聘帖 。 量子位 是一个关注AI及前沿科技的新媒体平台,我们着迷于全新技术和趋势带来的改变,并 正致力于帮助更多人第一时间看懂新趋势、新机遇。 如果你与我们志同道合,对 AI大模型、具身智能、终端硬件、AI新媒体编辑 感兴趣,我们 正在招聘这些领域的原创作者。 以下岗位均为全职,工作地点:北京中关村。 岗位面向:社招、应届毕业生,所有岗位均可实习——表现出色均可转正 加分项: 加入我们,你可以获得: 乐于探索AI新工具,善用AI新工具; 拥有解读论文的能力,能深入浅出讲解原理; 有写代码能力; 量子位长期读者。 站在AI浪潮之巅 :第一时间接触和了解AI领域最新技术和产品,构建完整的AI认知 体系。 玩转AI新工具 :将各种AI新技术、新工具应用于工作,提升工作效率和创造力。 打造个人影响力 :通过撰写独家原创内容,建立个人知名度,成为AI领域的意见领 袖。 在招岗位包括: AI大模型方向编辑作者 你需要做什么? 我们希望你是: 拓展行业人脉 :与AI领域大咖零距离接触,参与重要科技活动和发布会,拓展行业 视野。 ...
GPT-4V仅达Level-2?全球首个多模态通才段位排行榜发布,General-Level打造多模态通用AI评测新范式
量子位· 2025-05-16 01:24
General-Level团队 投稿 量子位 | 公众号 QbitAI 正因如此,在AI竞赛进入"下半场"之际(由最近的OpenAI研究员姚顺雨所引发的共识观点), 设计科学的评估机制俨然成为决定胜负的核心 关键 。 近期录用于ICML'25 (Spotlight)的论文《On Path to Multimodal Generalist: General-Level and General-Bench》提出了 一套全新的评 测框架General-Level 和 配套的数据集General-Bench ,为这一议题带来了奠基性的解答和突破。 该评测框架已落地于社区:上述论文的项目团队构建了涵盖700多个任务、覆盖5大常见模态、29个领域、多达32万+测试数据的超大规模评 测基准和业界最完善的多模态通才模型排行榜 Leaderboard ,为公平、公正、全面地比较不同多模态通才大模型提供了基础设施。 General-Level评估算法:五级段位体系与协同效应 General-Level评测框架引入了一个 五级段位体系 ,类似"段位晋级"的方式来衡量多模态模型的通才能力。 General-Level评估的核心在于 ...
量子位招聘 | DeepSeek帮我们改的招聘启事
量子位· 2025-05-16 01:24
这是一则 招聘帖 。 量子位 是一个关注AI及前沿科技的新媒体平台,我们着迷于全新技术和趋势带来的改变,并 正致力于帮助更多人第一时间看懂新趋势、新机遇。 如果你与我们志同道合,对 AI大模型、具身智能、终端硬件、AI新媒体编辑 感兴趣,我们 正在招聘这些领域的原创作者。 以下岗位均为全职,工作地点:北京中关村。 岗位面向:社招、应届毕业生,所有岗位均可实习——表现出色均可转正 加分项: 加入我们,你可以获得: DeepSeek 发自 凹非寺 量子位 | 公众号 QbitAI 未来同事,你好~ 乐于探索AI新工具,善用AI新工具; 拥有解读论文的能力,能深入浅出讲解原理; 有写代码能力; 量子位长期读者。 站在AI浪潮之巅 :第一时间接触和了解AI领域最新技术和产品,构建完整的AI认知 体系。 玩转AI新工具 :将各种AI新技术、新工具应用于工作,提升工作效率和创造力。 打造个人影响力 :通过撰写独家原创内容,建立个人知名度,成为AI领域的意见领 袖。 在招岗位包括: AI大模型方向编辑作者 你需要做什么? 我们希望你是: 拓展行业人脉 :与AI领域大咖零距离接触,参与重要科技活动和发布会,拓展行业 视野。 ...
超越OpenAI、拿下全球双料第一,“AI吴彦祖”背后大模型SOTA了!
量子位· 2025-05-16 01:24
明敏 发自 凹非寺 量子位 | 公众号 QbitAI 具体效果如何?一手实测在此: 用专业播音腔读一读量子位的文章?So easy~ 直接根据文章内容配上相应的语气和情绪,中英混杂轻松搞定,各种停顿和重音,完全就是顶级新闻播报员的感觉。 还能让霉霉为我们读论文。不仅是熟悉的美音,而且非常还原她个人特点。 如上效果, 只需几秒语音参考 ,即可让大模型当场完成超逼真复刻。 并且在提供SOTA级性能同时, 定价仅为ElevenLabs的一半甚至四分之一 ,性价比也称得上"全球SOTA"了。 超越OpenAI! 国产大模型突袭,AI语音生成天花板被重新定义了。 MiniMax最新发布 Speech-02 ,同时拿下 Artificial Analysis Speech Arena 和 Hugging Face TTS Arena 两项全球权威语音基准测 评 第一 ! 而且还是榜单前十名中 唯一 的国产玩家。 要知道,这俩榜首长期被OpenAI、ElevenLabs占据,前者不用多介绍,公认的AI领域全球NO.1梯队成员,后者也是专精AI语音合成赛道的 领军玩家。 如此能力,不少人其实不知不觉体验到了。 比如前段时间大 ...
ChatGPT的记忆机制被公开了
量子位· 2025-05-16 01:24
相较于原有的保存记忆功能,新功能更私人、更懂你。 鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI ChatGPT新版记忆功能居然被民间大佬 逆向工程了 ! 能引用历史记录,甚至还能悄悄藏个人资料? 最近OpenAI推出了一项名为 聊天历史记录 的额外记忆功能,允许ChatGPT引用历史对话以进行个性化交互。 相关功能默认关闭,需要用户自行在 "设置->个性化->参考聊天记录" 中启用。 | | azinal Canaratal What's ha like? Any nartiaular proad narcanality or traite | | 11+2 Alen do | | --- | --- | --- | --- | | I W: | Settings | | × | | 6 | | | | | | ලි General | Customization | | | | % Personalization | Custom instructions On > | | | | E Data controls | | | | | @ Builder profile | Memory Learn ...