Workflow
量子位
icon
Search documents
量子位招聘 | DeepSeek帮我们改的招聘启事
量子位· 2025-05-16 03:39
DeepSeek 发自 凹非寺 量子位 | 公众号 QbitAI 未来同事,你好~ 这是一则 招聘帖 。 量子位 是一个关注AI及前沿科技的新媒体平台,我们着迷于全新技术和趋势带来的改变,并 正致力于帮助更多人第一时间看懂新趋势、新机遇。 如果你与我们志同道合,对 AI大模型、具身智能、终端硬件、AI新媒体编辑 感兴趣,我们 正在招聘这些领域的原创作者。 以下岗位均为全职,工作地点:北京中关村。 岗位面向:社招、应届毕业生,所有岗位均可实习——表现出色均可转正 加分项: 加入我们,你可以获得: 乐于探索AI新工具,善用AI新工具; 拥有解读论文的能力,能深入浅出讲解原理; 有写代码能力; 量子位长期读者。 站在AI浪潮之巅 :第一时间接触和了解AI领域最新技术和产品,构建完整的AI认知 体系。 玩转AI新工具 :将各种AI新技术、新工具应用于工作,提升工作效率和创造力。 打造个人影响力 :通过撰写独家原创内容,建立个人知名度,成为AI领域的意见领 袖。 在招岗位包括: AI大模型方向编辑作者 你需要做什么? 我们希望你是: 拓展行业人脉 :与AI领域大咖零距离接触,参与重要科技活动和发布会,拓展行业 视野。 ...
GPT-4V仅达Level-2?全球首个多模态通才段位排行榜发布,General-Level打造多模态通用AI评测新范式
量子位· 2025-05-16 01:24
General-Level团队 投稿 量子位 | 公众号 QbitAI 正因如此,在AI竞赛进入"下半场"之际(由最近的OpenAI研究员姚顺雨所引发的共识观点), 设计科学的评估机制俨然成为决定胜负的核心 关键 。 近期录用于ICML'25 (Spotlight)的论文《On Path to Multimodal Generalist: General-Level and General-Bench》提出了 一套全新的评 测框架General-Level 和 配套的数据集General-Bench ,为这一议题带来了奠基性的解答和突破。 该评测框架已落地于社区:上述论文的项目团队构建了涵盖700多个任务、覆盖5大常见模态、29个领域、多达32万+测试数据的超大规模评 测基准和业界最完善的多模态通才模型排行榜 Leaderboard ,为公平、公正、全面地比较不同多模态通才大模型提供了基础设施。 General-Level评估算法:五级段位体系与协同效应 General-Level评测框架引入了一个 五级段位体系 ,类似"段位晋级"的方式来衡量多模态模型的通才能力。 General-Level评估的核心在于 ...
量子位招聘 | DeepSeek帮我们改的招聘启事
量子位· 2025-05-16 01:24
这是一则 招聘帖 。 量子位 是一个关注AI及前沿科技的新媒体平台,我们着迷于全新技术和趋势带来的改变,并 正致力于帮助更多人第一时间看懂新趋势、新机遇。 如果你与我们志同道合,对 AI大模型、具身智能、终端硬件、AI新媒体编辑 感兴趣,我们 正在招聘这些领域的原创作者。 以下岗位均为全职,工作地点:北京中关村。 岗位面向:社招、应届毕业生,所有岗位均可实习——表现出色均可转正 加分项: 加入我们,你可以获得: DeepSeek 发自 凹非寺 量子位 | 公众号 QbitAI 未来同事,你好~ 乐于探索AI新工具,善用AI新工具; 拥有解读论文的能力,能深入浅出讲解原理; 有写代码能力; 量子位长期读者。 站在AI浪潮之巅 :第一时间接触和了解AI领域最新技术和产品,构建完整的AI认知 体系。 玩转AI新工具 :将各种AI新技术、新工具应用于工作,提升工作效率和创造力。 打造个人影响力 :通过撰写独家原创内容,建立个人知名度,成为AI领域的意见领 袖。 在招岗位包括: AI大模型方向编辑作者 你需要做什么? 我们希望你是: 拓展行业人脉 :与AI领域大咖零距离接触,参与重要科技活动和发布会,拓展行业 视野。 ...
超越OpenAI、拿下全球双料第一,“AI吴彦祖”背后大模型SOTA了!
量子位· 2025-05-16 01:24
明敏 发自 凹非寺 量子位 | 公众号 QbitAI 具体效果如何?一手实测在此: 用专业播音腔读一读量子位的文章?So easy~ 直接根据文章内容配上相应的语气和情绪,中英混杂轻松搞定,各种停顿和重音,完全就是顶级新闻播报员的感觉。 还能让霉霉为我们读论文。不仅是熟悉的美音,而且非常还原她个人特点。 如上效果, 只需几秒语音参考 ,即可让大模型当场完成超逼真复刻。 并且在提供SOTA级性能同时, 定价仅为ElevenLabs的一半甚至四分之一 ,性价比也称得上"全球SOTA"了。 超越OpenAI! 国产大模型突袭,AI语音生成天花板被重新定义了。 MiniMax最新发布 Speech-02 ,同时拿下 Artificial Analysis Speech Arena 和 Hugging Face TTS Arena 两项全球权威语音基准测 评 第一 ! 而且还是榜单前十名中 唯一 的国产玩家。 要知道,这俩榜首长期被OpenAI、ElevenLabs占据,前者不用多介绍,公认的AI领域全球NO.1梯队成员,后者也是专精AI语音合成赛道的 领军玩家。 如此能力,不少人其实不知不觉体验到了。 比如前段时间大 ...
ChatGPT的记忆机制被公开了
量子位· 2025-05-16 01:24
相较于原有的保存记忆功能,新功能更私人、更懂你。 鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI ChatGPT新版记忆功能居然被民间大佬 逆向工程了 ! 能引用历史记录,甚至还能悄悄藏个人资料? 最近OpenAI推出了一项名为 聊天历史记录 的额外记忆功能,允许ChatGPT引用历史对话以进行个性化交互。 相关功能默认关闭,需要用户自行在 "设置->个性化->参考聊天记录" 中启用。 | | azinal Canaratal What's ha like? Any nartiaular proad narcanality or traite | | 11+2 Alen do | | --- | --- | --- | --- | | I W: | Settings | | × | | 6 | | | | | | ලි General | Customization | | | | % Personalization | Custom instructions On > | | | | E Data controls | | | | | @ Builder profile | Memory Learn ...
梁文锋署名DeepSeek新论文:公开V3大模型降本方法
量子位· 2025-05-15 08:37
金磊 不圆 发自 凹非寺 量子位 | 公众号 QbitAI 梁文锋 亲自参与的 DeepSeek最新论文 ,来了! 这一次,团队把DeepSeek-V3在训练和推理过程中,如何解决 "硬件瓶颈" 的方法公布了出来。 具体而言,DeepSeek-V3之所以可以只用2048块H800,就能达到超大规模集群(如数万块GPU)相当的训练效果,核心在于 四项创新技术 内存优化 多头潜在注意力(MLA) 那么这四项优化具体又是如何起到作用的,我们继续往下看。 软硬件协同的优化设计 在训练大模型这条路上,可以说一直有"三座大山"在占道。 首先就是 内存不够用 。 现在的大语言模型(比如GPT、Llama)变得越来越庞大,需要的存储空间激增。特别是它们使用的"注意力机制"会产生大量临时数据(KV Cache),占用大量显卡内存。 : 计算优化 混合专家模型(MoE)与FP8低精度训练 通信优化 多层网络拓扑与低延迟设计 推理加速 多token预测(MTP) 但高性能显存的容量增长太慢了,每年才增加不到50%,远远跟不上需求。 其次是 计算效率低 。 训练超大规模模型需要海量计算资源,传统 "稠密模型"(如 Llama-3)每 ...
个人开发者训400亿参数大模型:分布式算力,DeepSeek架构,3090单卡部署
量子位· 2025-05-15 08:37
以往类似规模的模型训练往往需要耗费大量的资源和时间,并且通常是由大型科技公司或专业研究机构凭借其雄厚的资金和算力优势来完成 的。 Psyche的出现让个人和小团体也可获取资源创建独特大规模模型。 闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 打破科技巨头算力垄断 ,个人开发者联手也能训练超大规模AI模型? Nous Research宣布推出 Psyche Network ,可以将全球算力整合起来训练强大的人工智能。 Psyche是一个基于 Deepseek的V3 MLA架构 的 去中心化训练网络 ,测试网首次启动时直接对 40B参数LLM 进行预训练,可以在 单个 H/DGX 上训练,并在3090 GPU上运行。 对此,有网友表示,Nous Research有潜力成为新的前沿AI实验室。 技术突破和网络架构 DisTrO优化器 在传统AI训练中,数据需在中心服务器与分布式GPU之间高频传输,带宽不足会导致GPU利用率暴跌。 2024年Nous研发的 DisTrO 分布式训练优化器,通过 梯度压缩(仅传输关键参数更新) 和 异步更新策略 ,将跨节点通信的数据量降低 90%以上, 突破了训练过程中的带宽限 ...
量子位招聘 | DeepSeek帮我们改的招聘启事
量子位· 2025-05-15 08:37
以下岗位均为全职,工作地点:北京中关村。 岗位面向:社招、应届毕业生,所有岗位均可实习——表现出色均可转正 加分项: 加入我们,你可以获得: DeepSeek 发自 凹非寺 量子位 | 公众号 QbitAI 未来同事,你好~ 这是一则 招聘帖 。 量子位 是一个关注AI及前沿科技的新媒体平台,我们着迷于全新技术和趋势带来的改变,并 正致力于帮助更多人第一时间看懂新趋势、新机遇。 如果你与我们志同道合,对 AI大模型、具身智能、终端硬件、AI新媒体编辑 感兴趣,我们 正在招聘这些领域的原创作者。 乐于探索AI新工具,善用AI新工具; 拥有解读论文的能力,能深入浅出讲解原理; 有写代码能力; 量子位长期读者。 AI大模型方向编辑作者 具身智能机器人方向编辑作者 终端硬件方向编辑作者 AI新媒体编辑(微博/小红书方向) 紧跟AI浪潮 :密切关注AI、大模型领域的最新动态和进展,保持对行业趋势的敏锐 洞察。 挖掘优质选题 :深入挖掘AI大模型领域的优质选题,策划并撰写深度文章、行业分 析等内容。 十级冲浪选手 :活跃于各大网络平台,收集整理行业资讯,捕捉热点话题。 参与内容运营 :学习并参与量子位内容的全平台运营,提 ...
量子位招聘 | DeepSeek帮我们改的招聘启事
量子位· 2025-05-15 06:26
DeepSeek 发自 凹非寺 量子位 | 公众号 QbitAI 未来同事,你好~ 这是一则 招聘帖 。 量子位 是一个关注AI及前沿科技的新媒体平台,我们着迷于全新技术和趋势带来的改变,并 正致力于帮助更多人第一时间看懂新趋势、新机遇。 如果你与我们志同道合,对 AI大模型、具身智能、终端硬件、AI新媒体编辑 感兴趣,我们 正在招聘这些领域的原创作者。 以下岗位均为全职,工作地点:北京中关村。 岗位面向:社招、应届毕业生,所有岗位均可实习——表现出色均可转正 加分项: 加入我们,你可以获得: 乐于探索AI新工具,善用AI新工具; 拥有解读论文的能力,能深入浅出讲解原理; 有写代码能力; 量子位长期读者。 站在AI浪潮之巅 :第一时间接触和了解AI领域最新技术和产品,构建完整的AI认知 体系。 玩转AI新工具 :将各种AI新技术、新工具应用于工作,提升工作效率和创造力。 打造个人影响力 :通过撰写独家原创内容,建立个人知名度,成为AI领域的意见领 袖。 在招岗位包括: AI大模型方向编辑作者 你需要做什么? 拓展行业人脉 :与AI领域大咖零距离接触,参与重要科技活动和发布会,拓展行业 视野。 获得专业指导 : ...
阿里开源全能视频模型!生成编辑都精通,1.3B版本消费级显卡可跑
量子位· 2025-05-15 06:26
一水 发自 凹非寺 量子位 | 公众号 QbitAI 业界功能最全、消费级显卡可跑、而且还是开源的?! 不卖关子了,这就是阿里最新开源的通义万相 Wan2.1-VACE ,号称当前业界功能最全的 视频生成与编辑模型 。 有多全呢?来看官方介绍海报: 按照万相产品负责人的说法,"所有你能想到的关于视频生成的玩法,几乎都在这里了"。 而且与以往不同,以上功能主打"All in one",都能在一个模型里体验。 目前Wan2.1-VACE一共有两个版本: 模型已在GitHub、Hugging Face和魔搭社区上线,动手能力强的小伙伴现在可自行本地化部署,至于其他想在产品端直接体验的朋友,可能 还要等一两天。 初阶玩法 :基础的文生视频、图生视频(含首尾帧)、视频生视频等; 中阶玩法 :加入编辑功能,局部抹除或替换、视频重绘、时长或背景延展等; 高阶玩法 :将各种能力花式组合。 下面我们依次挑其中的一些亮点来看。 OK,话不多说,我们直接看新模型究竟有哪些玩法。 视频生成领域的"全能选手" 生成的视频如下,不仅还原了文字所描述的氛围感,而且娃娃和小蛇的动作姿态都比较自然,整体构图和谐。 经过一番梳理,Wan2.1- ...