Workflow
量子位
icon
Search documents
花几百万开发布会结果无人问津?或许你该看看这个…
量子位· 2026-01-30 04:23
允中 发自 凹非寺 量子位 | 公众号 QbitAI 2025年,科技公司总算是悟了: 技术再硬,没人看见,等于没发生过。 发布会讲不动了,白皮书出不了圈,参数表也只在行业内自嗨。 但与此同时,另一条路正在变宽——无人驾驶被拍进真实街景,AI潜入了创作者的生活日常,前沿技术不再是用来"被科普"的知识点,而是 被当场验证、甚至随手吐槽的生活方式 。 科技内容不再束之高阁,开始像生活碎片一样,能 被刷到、被玩梗、被二创 。 这时,一个新的问题浮出水面:这还是我们印象中的科技传播吗? 答案很可能是 否定 的。 接下来发生的一切,更像是一场关于 "谁能让技术拥有大众体温" 的竞争。而在这场竞争中,抖音正意外地站到舞台中央。 短视频把技术拉回了第一现场 很多人其实并不知道,中国自动驾驶已经跑到什么位置了。 如果你在抖音刷到科技创作者 林亦 那条视频,就会对这个问题有了具体坐标。 在《中国无人出租横扫阿布扎比?深度探访:中国科技如何征服中东土豪》里,他亲身去到了阿联酋阿布扎比,体验了中国头部自动驾驶企业 文远知行 在当地的Robotaxi运营情况。 不是展厅,不是PPT,也不是发布会现场,而是日常打车场景,非常稀松平常。 ...
嚯,具身智能和脑机接口在康复医疗合体了
量子位· 2026-01-30 02:23
Core Viewpoint - The article discusses the integration of brain-machine interfaces (BMIs) and embodied intelligence in rehabilitation, highlighting the potential for these technologies to enhance patient recovery and redefine the roles of healthcare professionals and robots in medical settings [6][7][10]. Group 1: Brain-Machine Interface and Embodied Intelligence - The concept of combining BMIs with embodied intelligence is presented as a groundbreaking approach to rehabilitation, allowing robots to assist patients based on their brain signals [6][7]. - The integration of BMIs can potentially enable patients to control robotic devices through thought, enhancing the effectiveness of rehabilitation training [23][25]. - The article emphasizes that the future of rehabilitation may involve not only robots assisting doctors but also patients becoming "cyborgs" [8][10]. Group 2: Technological Advancements - Recent advancements in BMI technology, including lighter and more modular hardware, have made it feasible for large-scale deployment in clinical settings [31][36]. - The development of large models has improved the processing of complex brain signals, allowing for more accurate intention recognition [32][34]. - The article notes that the combination of these technological advancements has laid the groundwork for BMIs to actively participate in rehabilitation [35][36]. Group 3: Clinical Applications and Future Directions - Fourier's introduction of the "smart rehabilitation port" in 2020 has been a significant step in integrating advanced technologies into rehabilitation practices [11][12]. - The article outlines a strategic initiative to create a large-scale BMI data set to enhance the training of large models for better intention recognition [40][41]. - The potential for robots to serve as experimental platforms for understanding brain functions is highlighted, suggesting that they could facilitate research that is difficult to conduct directly on human subjects [64][65]. Group 4: Expert Insights and Discussions - Experts in the roundtable discussion emphasize the importance of leveraging intelligent devices to enhance the capabilities of healthcare professionals, rather than replacing them [49][56]. - The conversation also touches on the need for a comprehensive understanding of brain functions to improve the design of intelligent systems that can effectively interact with humans [51][62]. - The integration of BMIs, embodied intelligence, and AI is seen as a pathway to achieving significant advancements in both medical applications and broader societal impacts [60][63].
马斯克被曝合并SpaceX和xAI!估值1.5万亿美元,左手火箭右手AI
量子位· 2026-01-30 02:23
为了SpaceX的IPO,马斯克又有大动作! 路透社消息,马斯克 正在推进通过换股的方式,把旗下的SpaceX和xAI合并 。 克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 这一战略整合,正值SpaceX计划于今年晚些时候进行轰动性公开上市的关键前夕。 交易落地后,马斯克的火箭发射能力将与Grok人工智能模型彻底打通,整合在同一个商业屋檐下。 这也是马斯克一贯"商业帝国大一统"策略的延续,此前他已通过类似手段,将社交平台X并入了xAI体系。 SpaceX与xAI换股合并 根据路透社披露的消息,知情人士表示SpaceX与xAI正进行并购谈判,计划通过换股方式合并。 作为交易的一部分,有一些xAI高管也可以选择不要股票,直接拿现金,到目前为止,最终协议尚未签署。 不过这笔交易依然有实质进展——为了促进交易达成, 马斯克已经在内华达州设立了两个实体 。 这一系列紧锣密鼓的资本运作,其源头最早可追溯至2025年12月9日。彼时,彭博社率先披露了SpaceX正在秘密筹备公开上市的消息。 内华达州企业备案文件显示,这两个名为"K2 Merger Sub"的实体已于21日成立,其中一家有限责任公司将SpaceX及 ...
登顶行业SOTA的多模态视频生成标杆,昆仑天工刚给开源了
量子位· 2026-01-29 08:27
Core Viewpoint - The article discusses the launch and capabilities of the AI model SkyReels-V3 by Kunlun Tiangong, highlighting its advanced features in video generation and its open-source nature, which is seen as a significant technological advancement in the AI field [3][4][10]. Group 1: Model Features - SkyReels-V3 is a multi-modal video generation model capable of generating videos from text and images, extending video lengths, and creating virtual avatars [7][9]. - The model aims to eliminate the stiffness and disjointedness often associated with AI-generated videos, achieving a new level of realism and coherence [9][10]. - It supports various video formats and resolutions, allowing for seamless transitions and maintaining visual quality across different aspect ratios [19][45]. Group 2: Technical Innovations - SkyReels-V3 addresses common issues in AI video generation, such as the scarcity of high-quality training data, computational limitations, and a lack of understanding of physical laws [33][36]. - The model employs a "one core, multiple branches" architecture, utilizing a multi-modal in-context learning framework for differentiated fine-tuning across tasks [37][38]. - It incorporates advanced techniques like cross-frame pairing for data construction, multi-reference condition fusion for detail control, and mixed training strategies to enhance generalization [39][42][45]. Group 3: Performance Metrics - In comparative evaluations, SkyReels-V3 outperformed other models in terms of reference image consistency, instruction adherence, and visual quality [46][47]. - The model's video extension capabilities go beyond simple frame addition, employing intelligent semantic understanding to create coherent narrative continuations [49][54]. - It also features a virtual avatar model that can generate synchronized audio-visual content, supporting multi-character interactions and long video generation [55][60]. Group 4: Industry Context - The AI video generation sector is transitioning from mere technical demonstrations to a competitive landscape focused on commercial applications, with SkyReels-V3 standing out for its multi-modal capabilities and precision [64][65]. - Kunlun Tiangong's strategic focus on self-developed technologies and a diverse model matrix positions it as a leader in the AI space, with applications spanning various domains [68][70]. - The company has successfully launched multiple AI products catering to different consumer needs, establishing a sustainable cycle of technology, user engagement, and product innovation [73][74].
量子位编辑作者招聘
量子位· 2026-01-29 08:27
目前,我们有 三大方向 岗位招聘,希望你是 (或者能成为) 这三个方向的内容专家: 岗位均为全职,工作地点:北京中关村。 岗位面向: 加入我们,你可以获得: 以下是岗位详情: 编辑部 发自 凹非寺 量子位 | 公众号 QbitAI AI热潮还在汹涌,但如果你还不知道如何参与……那为什么不来 量子位 呢? 我们是一家以 追踪AI新进展 为核心的内容平台,经过8年积累,目前拥有顶流影响力,广泛且备受认可的产业资源,以及时代风口的最佳观 测和学习生态位。 AI产业方向 :关注基建层创新,包含芯片、AI Infra、云计算; AI财经方向 :关注AI领域创投和财报,跟踪产业链资本动向; AI产品方向 :关注AI在应用和硬件终端方向的进展。 社招:覆盖编辑、主笔、主编各个层级,按能力匹配岗位; 校招:应届毕业生,接受实习且可转正。 站在AI浪潮之巅 :第一时间接触和了解AI领域最新技术和产品,构建完整的AI认知体系。 玩转AI新工具 :将各种AI新技术、新工具应用于工作,提升工作效率和创造力。 打造个人影响力 :通过撰写独家原创内容,建立个人知名度,成为AI领域的意见领袖。 拓展行业人脉 :与AI领域大咖零距离接触,参 ...
大模型学会拖进度条看视频了!阿里新研究让视频推理告别脑补,实现证据链思考 | ICLR 2026
量子位· 2026-01-29 08:27
ReWatch团队 投稿 量子位 | 公众号 QbitAI 为什么让多模态大模型"一步一步思考" ("Let's think step by step") 来回答视频问题,效果有时甚至还不如让它"直接回答"? 在数学推理任务中,强化学习 (RL) 能通过"思考"大幅提升模型性能。但将同样的方法用于视频推理,效果却不尽如人意。 来自 阿里巴巴未来生活实验室 的研究团队认为,这背后是任务性质的根本差异:数学推理是纯文本空间的逻辑游戏,而视频推理需要模型在 视觉内容和文本逻辑之间反复穿梭、验证。简单地套用文本思维链,只会让模型产生更多"脑补"和幻觉。 3. 视频接地的思维链(ReWatch-CoT): 首创多智能体ReAct框架,模拟人类在思考复杂问题时"回看、确认"的行为。通过"推理智能 体"和"观察智能体"的协作,生成一条条明确记录了"去视频哪里看" (action) 和"看到了什么" (observation) 的推理轨迹,确保思维链的 每一步都与视频内容紧密绑定。 整个数据集的构建过程包含三个阶段: 分层字幕生成、高难度问答对生成、以及多智能体思维链合成 ,确保了数据的高质量和高难度。 为了解决这一难题,研 ...
这么哇塞的世界模型,竟然是开源的!
量子位· 2026-01-29 08:27
整整三天,一波接一波连续开源。 在机器人的 眼睛 (LingBot-Depth) 和机器人的 大脑 (LingBot-VLA) 之后,刚刚, 蚂蚁灵波 又开源了一个大的: 金磊 发自 凹非寺 量子位 | 公众号 QbitAI 通用的世界模型——LingBot-World。 是可以支持在10分钟时长里,一直生成、一直交互的那种,来感受一下这个feel: 不难看出,视觉效果已经做到了与DeepMind推出的 Genie 3 不相上下,但时间维度上明显是更长。 而且LingBot-World生成的视频不只是能看,你也可以 深度参与 其中。 你可以通过键盘(WASD)和鼠标,实时控制视角的推进、旋转,就像在玩一款3A大作一样: 当然, Agent 也能够在生成的世界中自主规划并执行动作。 与此同时,你也可以用 自然语言 的方式去 实时改变 生成世界里的一切。 例如我们"喂"给LingBot-World这样一张初始图: 就仿佛一切都在自然演进、发生一样: 并且LingBot-World还严格遵循现实世界的 物理规律 ,同样是这只猫咪,当它撞到沙发的时候就不会出现穿模的情况,会显得更加真实: 只需输入"前面放个烟花"(0 ...
OpenAI推理第一人创业了:要造“活到老学到老”的AI,先来融它70个亿
量子位· 2026-01-29 05:03
梦瑶 发自 凹非寺 量子位 | 公众号 QbitAI 果然,离开了OpenAI,大家都有美好的未来。(doge 从OpenAI离职还不到一个月,推理模型第一人 Jerry Tworek 就已经火速创业开新局了! 新公司名叫Core Automation,直接剑指 「持续学习」 领域,目前正计划疯狂筹集 10亿美元 ing (折合人民币约70亿元)…… 推理模型第一人创业,盯上了持续学习 咱先来聊聊Jerry Tworek是谁。 OpenAI的「模型推理能力」能走到今天,Jerry属于绝对绕不开的那个人。 虽说,新公司还没研究出个啥东西,但这可一点不影响网友们为昔日的OpenAI老前辈疯狂打call。 这不嘛,已经有朋友觉得,这家公司可能比SSI和Thinky Machines更值得看好了…… 出生在波兰的Jerry,本身就是强理论与数理功底出身。 在华沙大学完成数学硕士学位后,他并没有立刻投身AI研究,而是先去了阿姆斯特丹,从事了几年的 量化研究 工作。 那段时间里,他每天面对的都是优化问题、噪声数据和有效信号提取这些事儿,每天都在思考如何在不确定环境中做出更好的决策。 也正是在这套问题框架下,Jerry的研 ...
MoltBot作者被Claude刁难后:MiniMax M2.1是最优秀的开源模型
量子位· 2026-01-29 05:03
Core Viewpoint - The article discusses the rise and impact of Moltbot, a tool that automates workflows and enhances productivity for developers, highlighting its practical applications and the excitement it has generated in the tech community [1][2][3][4]. Group 1: Moltbot's Features and Applications - Moltbot has been utilized by developers to automate various tasks, such as writing blogs, tracking work hours, and generating customized reports, showcasing its versatility and efficiency [3][4]. - Developers have integrated Moltbot with tools like Notion and Toggl, allowing for seamless workflow management and automation of routine tasks [4]. - The tool's ability to evolve, such as developing voice features and personalized designs, has surprised users and enhanced its functionality [3]. Group 2: Market Response and Competition - The demand for Moltbot has led to the rapid launch of cloud services by major providers like Alibaba Cloud and Tencent Cloud, which offer environments for running Moltbot [6][7]. - Competitors in the market are emerging, with one tool claiming to provide zero-configuration deployment and extensive compatibility with various applications [9][10]. Group 3: Developer Insights and Future Prospects - Peter Steinberger, the creator of Moltbot, shared insights on his journey into AI development, emphasizing the importance of passion and experimentation in creating innovative tools [12][14][17]. - The project has gained significant traction, with a growing community and interest from investors, indicating a strong market potential for personal AI agents [36][39]. - Steinberger believes that the future of AI tools will involve more personalized and user-friendly interactions, potentially leading to a shift in how applications are developed and utilized [50][51].
谷歌Alpha家族再登Nature封面!刷新基因组预测SOTA,精准定位远端致病突变
量子位· 2026-01-29 02:30
克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 谷歌Alpha家族,再登Nature封面! 这次推出的全新成员 AlphaGenome ,将AI的预测疆域拓展到了最为宏大且神秘的 人类基因组图谱 。 AlphaGenome能够 同时对11种不同的基因调控过程进行综合预测 ,准确捕捉基因深处的复杂互动。 它能 深入分析复杂的基因剪接机制 ,识别细胞如何从单个基因生成多种蛋白质,以及这一过程何时会出错导致疾病。 例如,AlphaGenome对白血病相关基因TAL1的致病突变进行了精准还原,准确预测出8000个碱基之遥的区域发生的突变引起病变。 这能让人类更进一步了解免疫细胞失控增殖引发癌症的深层成因,同时也证明了该模型不仅能处理已知数据,更能对从未见过的DNA片段及 其未知突变做出准确预测。 综合成绩方面,其预测性能在各项测试中均持平或超越现有程序,成为当前基因组预测领域的SOTA模型。 目前,Google DeepMind已面向非商业研究开放AlphaGenome API。 同时预测11种基因调控过程 以及在直接关联疾病研究的变异效应预测任务中, 它与Borzoi、Enformer等现有模型进行了26轮 ...