Workflow
语言模型
icon
Search documents
元戎启行周光:智驾最终拼的是 AI 技术,不只是规模丨具身智能对话#13
晚点Auto· 2025-04-14 13:47
以下文章来源于晚点LatePost ,作者晚点团队 晚点LatePost . 晚一点,好一点 先有一个移动能力的 "通才",才有更强的智驾系统。 文 丨 张家豪 编辑 丨 程曼祺 全无人驾驶,始终被视作自动驾驶行业皇冠上的明珠,就像登顶珠穆朗玛峰有 19 条路线一样,不同的公司选 择了不同的路线通往无人驾驶的最终目标。 Waymo、小马们选择了基于高精地图的 RoboTaxi 路线,在特定的路线已经实现了 RoboTaxi,为市民提供没有 司机的出行服务;以特斯拉为代表的车企与供应商,则是通过渐进式路线,卖车搭配辅助驾驶方案,收集数据 一步步迭代方案,试图逼近技术极限。 没有人能笃定哪条路线一定能成功登顶,也还有不同的公司,在尝试不同的登顶路线。 在今年的英伟达 GTC( GPU Technology Conference)上,元戎启行周光提出了一套新的解法,他说,大语言 模型的发展,经历了从弱专家模型(初代 Siri)、到通才(ChatGPT)、再到强专家模型(垂直模型)的过 程。智驾也可以复制这样的路线,一个移动能力的通才,能开好汽车、能骑好摩托车、能让配送小车随时找到 你,之后就可能进化到强专家模型—— ...
The Information爆料:苹果的大公司病,是怎么搞砸了AI版Siri的?
Founder Park· 2025-04-14 11:34
科技媒体「The Information」近期发布了一篇关于苹果新版 Siri 延期发布内幕的评论文章,直指苹果 Siri 项目推迟发布背后隐藏的诸多问题。 模型技术路线摇摆、内部团队冲突、高层犹豫不决等,Siri AI 的失败,可以说是完整体现了一个公司面对新技术的「大公司病」。 文章基于 The Information 的文章编译,略有调整。 TLDR: 苹果 Siri 部门高级总监 Robby Walker 对此的说法是, 「但这也只是一个目标,并不意味着那时就会发布」。 换言之,关于新版 Siri 发布时间,最新的答案是: 苹果自己也不知道。 背后到底发生了什么?为何苹果在 AI 战略上进度这么缓慢,已经落后在其他手机品牌之后? 在 WWDC 2024 上预告的新版 Siri,迄今仍未发布。甚至有消息称,可能会延期到今年的 iOS 19 版本中才会正式发布。 Founder Park 正在搭建开发者社群,邀请积极尝试、测试新模型、新技术的开发者、创业者们加入,请扫码详细填写你的产品/项目信息,通过审核 后工作人员会拉你入群~ 进群之后,你有机会得到: 01 云端结合,还是一个云端模型 从大小模型协作到 ...
Circle to Search, XOXO:「圈定即搜」功能交互解析与入门指南
3 6 Ke· 2025-04-14 07:52
Core Points - Circle to Search is a new interaction method introduced by Google, first showcased at the Galaxy Unpack event, and is available on Samsung Galaxy S24 and Google Pixel 8 series devices [2][6] - The feature allows users to select screen areas with simple gestures and provides results based on the selection, enhancing the overall user experience on Android devices [3][7] Group 1: Functionality and User Experience - Circle to Search enables users to quickly access search results by selecting text or images on the screen, with additional tools for translation and music identification [3][8] - The design emphasizes rapid response, low error rates, and intuitive screen segmentation, making it more user-friendly compared to Google Lens [8][9] - The development team utilized a streamlined approach, focusing on prototype creation rather than extensive documentation, which led to a more agile development process [9][10] Group 2: Comparison with Competitors - Circle to Search significantly simplifies the search process compared to similar features in other operating systems like HyperOS and Flyme, which require waiting for screen recognition before initiating actions [15][17] - The integration of Google Search provides a robust backend for Circle to Search, allowing for immediate and relevant results, unlike some competitors that rely on slower AI models [17][20] Group 3: Technical Implementation - The feature leverages the new Android Ink API for smooth and responsive gesture recognition, enhancing the user experience with minimal latency [25][27] - Circle to Search supports various Android devices, including Google Pixel and select Samsung models, with a straightforward activation process [29][31] Group 4: Practical Applications - Users can utilize Circle to Search for various tasks, such as quickly sharing screenshots, translating text, and navigating to locations based on selected text [49][51] - The feature's versatility allows for seamless integration into daily activities, making it a valuable tool for information retrieval and sharing [52][53] Group 5: Future Prospects - Google aims to enhance Circle to Search by integrating AI capabilities, potentially improving its functionality while maintaining a smooth user experience [56][57] - The ongoing development reflects a commitment to creating a comprehensive and user-friendly search tool that adapts to the evolving needs of smartphone users [58][59]
一堂「强化学习」大师课 | 42章经
42章经· 2025-04-13 12:02
吴翼: RL 是机器学习这个大概念下一类比较特殊的问题。 曲凯: 今天我们请来了国内强化学习 (RL) 领域的专家吴翼,吴翼目前是清华大学交叉信息研究院 助理教授,他曾经在 OpenAI 工作过,算是国内最早研究强化学习的人之一,我们今天就争取一 起把 RL 这个话题给大家聊透。 首先吴翼能不能简单解释一下,到底什么是 RL? 传统机器学习的本质是记住大量标注过正确答案的数据对。 举个例子,如果你想让机器学习能分辨一张图片是猫还是狗,就要先收集 10000 张猫的照片和 10000 张狗的照片,并且给每一张都做好标注,让模型背下来。 上一波人工智能四小龙的浪潮其实都以这套框架为基础,主要应用就是人脸识别、指纹识别、图 像识别等分类问题。 这类问题有两个特点,一是单一步骤,比如只要完成图片分辨就结束了;二是有明确的标准答 案。 但 RL 很不一样。 RL 最早是用来打游戏的,而游戏的特点和分类问题有两大区别。 第一,游戏过程中有非常多的动作和决策。比如我们玩一个打乒乓球的游戏,发球、接球、回 球,每一个动作都是非标的,而且不同的选择会直接影响最终的结果。 第二,赢得一场游戏的方式可能有上万种,并没有唯一的标准答 ...
一堂「强化学习」大师课 | 42章经
42章经· 2025-04-13 12:01AI Processing
曲凯: 今天我们请来了国内强化学习 (RL) 领域的专家吴翼,吴翼目前是清华大学交叉信息研究院助理教 授,他曾经在 OpenAI 工作过,算是国内最早研究强化学习的人之一,我们今天就争取一起把 RL 这个话题 给大家聊透。 举个例子,如果你想让机器学习能分辨一张图片是猫还是狗,就要先收集 10000 张猫的照片和 10000 张狗 的照片,并且给每一张都做好标注,让模型背下来。 首先吴翼能不能简单解释一下,到底什么是 RL? 上一波人工智能四小龙的浪潮其实都以这套框架为基础,主要应用就是人脸识别、指纹识别、图像识别等 分类问题。 吴翼: RL 是机器学习这个大概念下一类比较特殊的问题。 传统机器学习的本质是记住大量标注过正确答案的数据对。 所以我觉得人生有一个很好玩的地方是,你需要花很多时间先探索自己的奖励函数是什么,很多人可能努 力了很长时间,最后却发现找错了奖励函数。 这类问题有两个特点,一是单一步骤,比如只要完成图片分辨就结束了;二是有明确的标准答案。 但 RL 很不一样。 RL 最早是用来打游戏的,而游戏的特点和分类问题有两大区别。 第一,游戏过程中有非常多的动作和决策。比如我们玩一个打乒乓球的游戏, ...
一堂「强化学习」大师课 | 42章经
42章经· 2025-04-13 12:01
曲凯: 今天我们请来了国内强化学习 (RL) 领域的专家吴翼,吴翼目前是清华大学交叉信息研究院助理教授,他曾经在 OpenAI 工作过,算是国内最早研究强化学 习的人之一,我们今天就争取一起把 RL 这个话题给大家聊透。 首先吴翼能不能简单解释一下,到底什么是 RL? 因此,RL 其实更通用一些,它的逻辑和我们在真实生活中解决问题的逻辑非常接近。比如我要去美国出差,只要最后能顺利往返,中间怎么去机场、选什么航 司、具体坐哪个航班都是开放的。 但 RL 很不一样。 RL 最早是用来打游戏的,而游戏的特点和分类问题有两大区别。 第一,游戏过程中有非常多的动作和决策。比如我们玩一个打乒乓球的游戏,发球、接球、回球,每一个动作都是非标的,而且不同的选择会直接影响最终的结 果。 第二,赢得一场游戏的方式可能有上万种,并没有唯一的标准答案。 所以 RL 是一套用于解决多步决策问题的算法框架。它要解决的问题没有标准答案,每一步的具体决策也不受约束,但当完成所有决策后,会有一个反馈机制来评 判它最终做得好还是不好。 吴翼: RL 是机器学习这个大概念下一类比较特殊的问题。 传统机器学习的本质是记住大量标注过正确答案的数据对。 ...
人类一生所学不过4GB,加州理工顶刊新研究引热议
量子位· 2025-04-13 04:08
西风 一水 发自 凹非寺 量子位 | 公众号 QbitAI 24小时不间断学习且不遗忘,一辈子也只有 4GB 的"知识储量"? 科学家们最新研究,计算出了人类学习积累上限,就这么多~~ (甚至还不如一块U盘能装) 。 这是来自Cell旗下神经科学顶刊Neuron上的一项工作,它提出了一个发人深省的悖论: 人类信息处理速度仅为每秒10bit,而我们的感官系统却能以每秒10亿bit的速率收集数据。 大语言模型 每个参数就能存储2bit 知识,一个70亿参数的模型就能存储140亿bit的知识。 △ 结论来自华人学者朱泽园"Physics of Language Models"系列论文 难怪研究人员还提出了一项推论: 随着算力的不断提升,机器在各类任务中的表现超越人类只是时间问题。 另外,按照这项研究的结论,马斯克目前的脑机接口研究也有问题了。 研究人员表示: $\mathbf{S}i=\text{Sifting Number}=\dfrac{\text{Sensory information rate}}{\text{Bewiavel throughput}}=\dfrac{1\text{Gbit/s}}{10\t ...
元戎启行周光:智驾最终拼的是 AI 技术,不只是规模丨具身智能对话#13
晚点LatePost· 2025-04-10 14:52
先有一个移动能力的 "通才",才有更强的智驾系统。 文 丨 张家豪 编辑 丨 程曼祺 全无人驾驶,始终被视作自动驾驶行业皇冠上的明珠,就像登顶珠穆朗玛峰有 19 条路线一样,不同的公司选 择了不同的路线通往无人驾驶的最终目标。 Waymo、小马们选择了基于高精地图的 RoboTaxi 路线,在特定的路线已经实现了 RoboTaxi,为市民提供没有 司机的出行服务;以特斯拉为代表的车企与供应商,则是通过渐进式路线,卖车搭配辅助驾驶方案,收集数据 一步步迭代方案,试图逼近技术极限。 没有人能笃定哪条路线一定能成功登顶,也还有不同的公司,在尝试不同的登顶路线。 在今年的英伟达 GTC( GPU Technology Conference)上,元戎启行周光提出了一套新的解法,他说,大语言 模型的发展,经历了从弱专家模型(初代 Siri)、到通才(ChatGPT)、再到强专家模型(垂直模型)的过 程。智驾也可以复制这样的路线,一个移动能力的通才,能开好汽车、能骑好摩托车、能让配送小车随时找到 你,之后就可能进化到强专家模型——L5 级别自动驾驶,这套系统被元戎启行称为 RoadAGI,移动能力的通 才系统。 在演示 D ...
招商银行首席信息官周天虹:大语言模型给银行业带来的四重变化
Cai Jing Wang· 2025-04-10 12:22
Core Insights - The current wave of artificial intelligence, particularly large language models, presents significant opportunities for the banking industry, enhancing service delivery and operational efficiency [1] Group 1: Changes in Service Models - The banking industry has traditionally focused on serving a limited number of key clients, adhering to the "80/20 rule." With the advent of large language models, banks can transition to a "one customer at a time" approach, enabling personalized services for all clients [2] Group 2: Changes in Work Models - The banking sector, being labor-intensive, can leverage large language models to assist or even replace human employees in repetitive tasks, fostering a new collaborative environment between human and intelligent agents [2] Group 3: Changes in Interaction Models - Interaction methods are evolving from purely graphical user interfaces (GUI) to a combination of GUI and chat functionalities, allowing for dynamic interface organization based on customer intent, thus enhancing user experience [2] Group 4: Changes in Data Analysis - Large models significantly improve data analysis efficiency and lower the barriers to entry, enabling more individuals to engage in data analysis activities [3]
【招银研究|行业深度】AI应用之生物医药——科技变革初绽医药新格局
招商银行研究· 2025-04-09 09:25
■ AI制药概览。 AI制药即人工智能驱动药物研发,包括靶点和药物发现、临床前实验设计、临床开发及老药新用等多个方向。其中,靶点和药物发现与临床研发需 求强烈&市场空间大,是AI制药的主要方向。纵观AI制药的发展历程,随着计算能力和数据量的大幅增长,AI制药已经进入应用拓展阶段,传统的计算机辅助药物 设计(CADD)也升级为人工智能驱动药物研发(AIDD)。 ■ 需求和政策推动下,AI制药投资持续增长。 随着低垂果实的摘取,新药研发难度不断增大。为了提升研发效率,降低研发成本,AI制药的需求不断凸显。政策方 面,AI制药已经成为国家重点支持方向,欧美也在完善政策支持和指引。2015-2022年,AI制药投融资年复合增速达49.7%。即使在全球医药投融资市场较弱的2022- 2024年,AI制药投融资仍相对活跃。行业规模来看,预计2028年全球AI制药市场规模达56.2亿美元。据麦肯锡预测,长期来看市场规模有望达到280-530亿美元。 ■ 靶点与药物发现:应用范围不断扩大,但仍需湿实验共同验证。 该部分是AI制药最早探索的领域,技术更多是传统的知识图谱、深度学习等。整体来看, AI技术 可以通过快速深度挖掘与 ...