量子位
Search documents
智能体A2A落地华为新旗舰,鸿蒙开发者新机遇来了
量子位· 2025-12-06 03:21
Core Viewpoint - The article discusses the transformative impact of Huawei's HarmonyOS 6 and its integration of AI capabilities, particularly through Agent to Agent (A2A) collaboration, which redefines mobile application interactions and enhances user experience [7][9][39]. Group 1: AI Integration and User Experience - The Mate X7, powered by HarmonyOS 6, showcases the first commercial implementation of A2A collaboration, allowing applications to work together seamlessly [3][5]. - Users can now interact with their devices using natural language, enabling a more intuitive and efficient way to access services without navigating through multiple apps [10][18]. - The A2A protocol allows previously isolated applications to function as a cohesive "smart service team," enhancing the overall efficiency of task completion [21][24]. Group 2: Technical Framework and Development - HarmonyOS 6 introduces a new technical framework that allows for deep integration of AI with hardware, facilitating standardized interactions between different smart agents [25][26]. - The Intents Kit and unified communication protocols are foundational to the A2A collaboration mechanism, enabling precise interpretation of user commands and efficient service delivery [27][28]. - The HMAF framework simplifies the development process for creating intelligent agents, allowing existing applications to evolve without complete redesign [31][32]. Group 3: Market Implications and Strategic Opportunities - The shift from "user finding applications" to "services finding users" represents a significant evolution in the mobile internet landscape, driven by user demand for efficiency [39][40]. - The growing number of HarmonyOS devices, exceeding 27 million, indicates a rapid adoption of this new interaction paradigm, positioning Huawei to capture a significant market share [42][44]. - Huawei's "Tiangong Plan," with an investment of 1 billion RMB, aims to support the development of AI-native services and frameworks, fostering innovation within the ecosystem [45][46].
《三体》“宇宙闪烁”成真!免佩戴裸眼3D屏登Nature
量子位· 2025-12-06 01:30
克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 《三体》中的"宇宙为你闪烁",不再是科幻了。 最新登上Nature的显示屏EyeReal,无需佩戴眼镜就能把3D画面精准投射到你的眼中。 而且尺寸只有桌面显示器大小,成本也非常低廉,一块4090加上屏幕和游戏机传感器就能搞定。 中国团队出品,一作还是一位26岁复旦在读博士生,上海人工智能实验室、上海创智学院联合培养。 无需佩戴实现裸眼3D EyeReal技术实现了一种裸眼3D显示方案,观看视角的覆盖范围超过100度。 而且在这个范围内,你随便走动,画面都是连续顺滑的,不会像以前那种老设备一样,稍微一动脑袋画面就乱跳或者出现重影。 长相上,它的大小和普通的24寸桌面显示器相当,但别小看这个尺寸,它的有效3D成像面积达到了0.1到0.2平方米,跟以前那种只能显示指 甲盖大小的全息技术比起来,足足大了1000倍。 在立体感方面,它实现了真正的"全视差"显示,不仅支持左右看(水平),还支持上下看(垂直)和前后凑近了看(径向)这三个维度。 当你站起来或者把脸凑近屏幕时,画面里的物体会像真实模型一样,呈现出完全符合物理规律的几何透视变化。 而且,EyeReal还有个 ...
知名数学家辞职投身AI创业:老板是00后华人女生
量子位· 2025-12-06 01:30
鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI 确实也是轰动数学和AI两界了。 因为就在最近,世界级顶尖数学家宣布辞职,前往硅谷,全职加入AI初创公司—— 这家公司,还是自己学生创办的—— 一个24岁00后华人女生 。 这个数学家,正是被誉为"最懂拉马努金的当代数论学者"的 小野肯 (Ken Ono) 。 一辈子都扑在纯数学上,拿奖拿到手软、荣誉满身的他,如今脱掉学者长衫,带着学生一块儿辞职创业,其抉择堪称激进。 吸引他的这家公司,也不是等闲之辈,而是硅谷新贵——Axiom,一家 主打AI数学 的明星公司。 几个月前,凭借0产品0用户就实现了3亿美元估值,创始人24岁、斯坦福数学博士辍学,名叫 洪乐潼 (Carina Letong Hong) 。 洪是公认的数学少年天才、IMO金牌得主、三年MIT数学和物理双学位、2022年度中国罗德学者,也是仅有的4名中国获奖者之一…… 如今师生搭档,创业之路再获强大助力。 最不可能做AI的人做AI了 据悉,小野肯将作为该公司的第15位员工加入,职位是 创始数学家 。 他主要的工作是推动内部AI模型达到性能极限,通过设计出只有深度理解数学原理才能够解决的数学问题,以及 ...
谷歌新架构突破Transformer超长上下文瓶颈!Hinton灵魂拷问:后悔Open吗?
量子位· 2025-12-05 09:33
Core Insights - Google has recently made significant advancements in AI, particularly in addressing the limitations of the Transformer architecture regarding long context processing [5][7][32] - The introduction of new models, Titans and MIRAS, aims to combine the speed of RNNs with the performance of Transformers, allowing for the expansion of context windows up to 2 million tokens during inference [2][11][14] Group 1: New Architectures - Titans is a new architecture that incorporates a neural long-term memory module, which dynamically updates weights during inference, enhancing the model's ability to retain and process information [14][15] - MIRAS serves as the theoretical framework behind Titans, focusing on integrating new and old information efficiently without losing critical concepts [22][28] Group 2: Memory Mechanisms - The Titans architecture introduces the concept of "Memory as Context" (MAC), which allows the model to use long-term memory as additional context for the attention mechanism, improving its ability to summarize and understand large amounts of information [16][18] - The model's ability to selectively update long-term memory based on "surprise metrics" enables it to prioritize significant new inputs while maintaining efficiency [19][20][21] Group 3: Performance Comparison - Experimental results indicate that models based on Titans and MIRAS outperform state-of-the-art linear recurrent models and comparable Transformer baseline models, demonstrating superior performance even with fewer parameters [27][32] - The new architecture's capability to handle extremely long contexts positions it as a strong competitor against large models like GPT-4 [32] Group 4: Future of AI Models - The exploration beyond Transformers continues, but the Transformer architecture remains a foundational theory in the era of large models [33] - Google's decision to publicly share its Transformer research has had a profoundly positive impact on the AI community, as noted by industry leaders [34]
Office危!阿里千问这回把“办公全家桶”打包进了对话框
量子位· 2025-12-05 09:33
梦瑶 发自 凹非寺 量子位 | 公众号 QbitAI 能写作策划、能生成PPT,还能在线编辑,最关键的是:还能白嫖~ 刚刚,阿里千问悄悄把 办公 和 写作 能力升级了一遍:文档生成、智能排版、在线编辑、多格式转换全都打包进一个入口里: 在PPT创作上,千问不光能理解图片、文档、语音,还能自动识别重点、匹配模板,直接生成一份能交差的成品报告: 总之,办公学习这俩事儿现在在一个千问App里就能串起来了。 到底好不好用,咱直接上手看。 现在在千问能实现PPT创作自由了 先来说说这次升级中我自认为最大的看头——PPT创作能力。(毕竟在学校和公司我们的boss们没少让我们做…) 咱直接拿一个打工人每年底都逃不掉的场景开测:让千问做一份「年终工作总结汇报」。 我上传了一份word文档资料给AI当参考,上传后千问没有立刻开做,而是先给出了一份PPT大纲。封面、章节结构、每页要写啥,全列得明 明白白: 如果我们对提纲的内容不满意,可以直接点击 编辑大纲 对内容进行文字编辑,哪里不对改哪里: 大概过了几秒钟一份图文并茂完整的PPT就做好了~ 但是我们平时做PPT时花费最长的时间不是把文字粘贴到PPT,而是后续的 排版美化 步骤 ...
GPT-5从零提出量子物理新想法,物理学家写成论文已登Physics Letters B
量子位· 2025-12-05 08:04
梦晨 发自 凹非寺 量子位 | 公众号 QbitAI AI给物理学家打下手?不,这次反过来了。 密歇根州立大学物理学家 Stephen Hsu 刚刚在 《Physics Letters B》 上发表了一篇量子物理论文,核心思想由GPT-5从零提出, 这可能是第一篇主要想法来自AI的理论物理研究论文。作者本人也在社交媒体上确认了这一点: 我认为我发表了第一篇理论物理研究论文,其中的主要思想来自AI——在这个案例中是GPT-5。 GPT-5的量子物理论文讲了什么 这篇论文探讨的是一个极其根本的物理学问题: 量子演化是否严格线性? 通俗地说,我们熟悉的量子力学是 "线性" 的,那如果给它加一些 "非线性" 的修改(让量子状态的变化不仅和自身有关,还和整个系统的状态 挂钩),能不能依然符合相对论的要求(比如信息不能超光速传播、物理规律不随观测角度变)。 Stephen Hsu使用 Tomonaga-Schwinger理论框架 来分析,核心结论很如下: 大多数非线性修改都没法和相对论兼容,问题主要出在 "locality"(远处的事件不能瞬间影响近处)和 " foliation independence"(不管从哪 个 ...
优理奇机器人完成两轮合计3亿元天使++++轮及天使+++++轮融资,“算法-硬件-场景”三位一体加速具身智能应用落地
量子位· 2025-12-05 08:04
允中 发自 凹非寺 量子位 | 公众号 QbitAI 优理奇机器人(UniX AI) 近日宣布完成两轮合计 3亿元 天使++++轮及天使+++++轮融资,由川商基金、吴中金控、益华资本、青域基金、 太浩创投等机构,以及若干上市公司及产业方参与投资,老股东赛纳资本追加投资。 这是公司在 半年内 交割的 第五轮 融资,获得资本持续青睐的背后,是优理奇在 具身智能领域"算法-硬件-场景" 三位一体的稀缺价值得到市 场认可。 场景落地提速:从世界冠军到量产交付 优理奇始终坚持"场景驱动"的发展路径,将产品在真实商业环境中持续积累验证数据,反哺算法模型与技术迭代。 在"算法×真实环境×工程化"成为竞争焦点的当下,公司已建立起从训练模型到真实反馈的快速迭代闭环。 与此同时,公司积极构建科研教育生态,面向高校与科研机构推出 标准化机械臂产品UniOpenArmX 。 该产品在IROS 2025全球顶级机器人会议上首发,优理奇首席科学家及本届IROS大会总主席 王贺升教授 深度参与产品定义,以"可教学、可 编程、可复现"为特点,配备完整ROS2接口,为科研与教育提供高效基础设施,进一步巩固公司在技术生态中的影响力。 具身智能 ...
视频模型也能推理,Sora2推理能力超过GPT-5
量子位· 2025-12-05 08:04
DeepWisdom团队 投稿 量子位 | 公众号 QbitAI 视频模型能不能通过生成视频来解决推理问题?—— 答案是 能 。尤其在空间类任务(比如走迷宫)上,比图文模型更擅长,更稳。 DeepWisdom研究团队提出: 视频生成模型不仅能画画,更能推理 。 它们通过生成连续的视频帧来进行时空规划,这种能力在处理复杂空间任务时,甚至超越了GPT-5和Gemini 2.5 Pro等顶尖的多模态大模 型。 | Method | | | EM (1) | | | | | SR (1) | | | | | PR (↑) | | | | | SD (1) | | | | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | | | Base | Irreg | Trap | 3D | Soko | Base | Irreg | Trap | 3D | Soko | Base | Irreg | Trap | 3D | So ...
北航领衔发布300页代码智能综述:从基础模型到智能体,一次读懂Code LLM全景图
量子位· 2025-12-05 05:33
北航团队 投稿 量子位 | 公众号 QbitAI 一文梳理代码智能领域技术链路。 这篇学术论长文由 北京航空航天大学复杂关键软件环境全国重点实验室领衔 、联合阿里巴巴、字节跳动、腾讯、华为、NUS、Monash 等近 30家机构共同撰写,在AI圈引发了许多讨论。 《From Code Foundation Models to Agents and Applications》一文是对过去几年代码智能领域的一次系统梳理:模型、任务、训练、智 能体、安全与应用都被串联成了一条完整、连贯的技术链路。 整篇论文不仅回顾了技术发展,也通过大量实验、框架和案例解释了 "哪些方法真正有效、哪些方向正在变得重要" ,更像是一份面向产业的 实践指南。 编程范式正在迎来新的发展阶段 论文从一条直观的演化路径切入:从手动编码、IDE辅助,到框架驱动,再到如今的 AI-Assisted协作式开发 。过去我们通过代码描述需 求,而现在的趋势正在转变——开发者更习惯于用自然语言表达意图,由模型完成更大比例的实现。 随着上下文窗口不断增大、工具调用能力增强,这种协作方式正在悄然改变工程师的习惯。 当模型能够理解项目结构、掌握 API、自动补 ...
谷歌最强大模型付费上线,在DeepSeek开源后被吐槽太贵
量子位· 2025-12-05 05:33
Jay 发自 凹非寺 量子位 | 公众号 QbitAI 奥特曼又得拉响红色警报了。 刚刚,谷歌再次扔出重磅炸弹—— Gemini 3 Deep Think 正式上线! 这款谷歌最新最强模型,推理能力确实有点离谱。 轻松把草图变成逼真3D场景,不仅结构还原到位,就连镂空花纹与光影都处理得明明白白。 甚至有网友拿它搞起了视觉艺术,一人一AI在虚拟宇宙里「不知天地为何物」。 看完这些demo,估计奥特曼只得再次咬牙切齿送上「happy for u」了。 (doge) 几句话就能搭出个3D多米诺骨牌解压游戏,运行相当丝滑。 Ultra用户今天就能通过Gemini聊天框里的「Deep Think」选项用起来了~ 高歌猛进的Gemini,又一次屠榜 不给对手任何喘息的机会,Gemini 3 Pro刚给OpenAI按在地上锤完,谷歌转手又扔出一重磅炸弹——Gemini 3 Deep Think。 相比之前的模型,新版本在复杂数学、科学推理和逻辑问题上都有大幅提升,旨在攻克那些连最强模型都难以解决的数学、科学和逻辑问题。 具体来说,在「深度思考」模式下,Gemini会开启迭代推理,能多轮打磨代码,生成更精细的程序,从而在可视 ...