Workflow
大语言模型(LLM)
icon
Search documents
AI也需要"记笔记":Karpathy从Claude 1.6万字提示词中看到的未来
歸藏的AI工具箱· 2025-05-12 08:28
LLM 的系统提示就是在对话一开始递给 AI 的"一页说明书",用来告诉它该扮演什么角色、遵守哪 些规则、用什么方式回答用户。 大概来看一下这么长的提示词里面主要都是一些什么内容: 而且整个提示词中充满了临时修改的的痕迹,这些修改往往没有使用 XML 或者 Markdown 格式的列表,就 是一段话,看起来像是针对一些热点事件或者问题修复打的补丁。 **Acknowledgments** I would like to thank my supervisor, for his kind of support. I would like to thank my supervisor, for his kind of support. 如果懒得看内容可以听一下,播客使用 listenhub 制作 前几天 Cluade 新的系统提示词泄露了,居然有 16,739 个单词,非常长。 相比之下,OpenAI 在 ChatGPT 中的 o4-mini 的系统提示有 2,218 个单词,只是 Claude 的 13%。 什么是系统提示词 Claude 整个系统提示词这么长维护和更新甚至版本控制应该都需要一个专门的流程,不然 ...
马来西亚,下一个全球数据中心霸主?
财富FORTUNE· 2025-05-09 13:03
马来西亚柔佛州即将建成的"探索新城"办公楼的内部设计效果图。图片来源:Courtesy of ZA 19世纪40年代,新加坡的华人先民横渡柔佛海峡(Johor Strait),在马来西亚柔佛州的原始丛林中披荆 斩棘,建立起绵延不绝的黑胡椒种植园。20世纪的英国殖民时期,这些胡椒农场逐渐被广袤的橡胶林与 油棕榈园所取代。如今,在同一片土地上,柔佛州正在悉心培育数字时代的新型经济作物——为缓解全 球算力饥渴而建设的人工智能数据中心群。 柔佛的数据中心建设狂潮,与当年改种胡椒的产业转型如出一辙,根源都在新加坡的资源瓶颈。这个城 邦国家虽然贵为东南亚的数字中枢,却连水电供给都依赖进口。2019年,因为庞然巨物般的数据中心不 仅消耗大量水资源,更消耗了新加坡7%的电力,政府不得不叫停新建项目。投资方与运营商旋即跨海 而来,在土地成本优势显著、能源供给充沛,以及矢志助推数字经济发展的马来西亚落子布局。 而柔佛跻身数据中心重镇的另一关键推力,在于全球算力争夺战的白热化。尽管新加坡在2022年1月已 经放开数据中心禁令,但岁末ChatGPT的震撼问世引爆全球人工智能基础设施需求,也在马来西亚掀起 新一轮的投资狂潮。房地产咨询 ...
苹果谷歌“闹分手”?iPhone搜索或转投AI,高管揭秘
3 6 Ke· 2025-05-08 23:59
此案核心争议是两家公司价值约200亿美元(约合人民币1447亿元)/年的协议,该协议让谷歌搜索成为苹果浏览器默认搜索引擎。此案可能迫 使科技巨头解除合作,颠覆iPhone等设备长期以来的运作方式。 01.Safari搜索量首次下滑,AI抢夺传统搜索引擎"蛋糕" 自2007年初代iPhone发布以来,苹果用户始终通过谷歌进行网页搜索,而如今消费者将进入由多家公司AI主导的新时代。 苹果和谷歌要"分手"? 智东西5月8日消息,据知名苹果爆料人、彭博社记者马克·古尔曼(Mark Gurman)最新报道,苹果公司正在"积极考虑"彻底改造其设备上的 Safari网络浏览器,将重点转向AI驱动的搜索引擎。 苹果与谷歌持续二十年战略合作关系似乎出现"裂痕",重大行业变革被按下"加速键"。 本周三,苹果互联网软件和服务部门高级副总裁埃迪·库(Eddy Cue)在美国司法部起诉谷歌母公司Alphabet的案件中作证时披露了这一信息。 埃迪·库提到,Safari搜索量上月首次下滑。他认为这是因为AI工具吸引了部分用户的视线,包括OpenAI、Perplexity AI和Anthropic在内的AI搜 索提供商终将取代Alphab ...
中金 | 大模型系列(2):LLM在个股投研的应用初探
中金点睛· 2025-05-08 23:33
点击小程序查看报告原文 Abstract 摘要 LLM在个股投研的应用:因子挖掘、个股复盘 随着资本市场信息生产机制的加速迭代,上市公司每日披露的公告、舆情、产业链动态等非结构化数据呈现指数级增长。传统人工复盘模式受限于信息处 理效率与认知边界,已难以满足投资者对海量增量信息的实时追踪与价值提炼需求;成熟的基本面选股逻辑如何高效地转化为定量因子也是困扰投资者的 重要问题。本报告提出,通过大语言模型(LLM)技术构建智能化个股复盘框架和基本面因子生成框架,期望通过技术赋能的方式助力投资者实现投研 工作流的提质增效。 主观逻辑因子化和个股复盘或为LLM在个股投研中较好的应用场景。 利用LLM构造基本面选股因子的挖掘框架,可以发挥LLM在推理能力和创造性方面 的优势,提高主观选股逻辑到量化因子的转化效率。利用LLM构建智能化个股复盘体系,可以发挥LLM在处理非结构化数据及观点总结能力方面的优 势,可有效抽取每日关键信息,高效复盘每日最新信息,输出带有一定置信度评估的初步结论,为投资者提供决策参考锚点。 基于LLM的基本面因子挖掘框架:发挥LLM的创造力 关键点:Prompt引导因子创造方向。 在基于LLM的基本面因 ...
GPT-4o医学知识覆盖率仅55%?腾讯优图团队发布大模型医疗能力“体检报告”
量子位· 2025-04-30 04:10
医疗大模型知识覆盖度首次被精准量化! 在医疗领域,大语言模型(LLM)的潜力令人振奋,但其知识储备是否足够可靠?腾讯优图实验室天衍研究中心的最新研究给出了答案。 他们提出的 MedKGEval框架 ,首次通过医疗知识图谱(KG)的多层级评估,系统揭示了GPT-4o等主流模型的医学知识覆盖度。 该研究已被WWW 2025会议Web4Good Track录用为口头报告(oral)。目前,WWW 2025正在悉尼举行,会议时间从4月28日持续至5月2 日。 MedKGEval团队 投稿 量子位 | 公众号 QbitAI 背景 大语言模型(LLM)在医疗领域的快速发展凸显了其知识存储与处理的潜力,但其临床部署前的可靠性验证亟需更系统化的评估框架。 当前主流的Prompt-CBLUE、Medbench和MedJourney等评估体系虽通过医学问答基准测试LLM的任务执行能力,却存在三个明显的局限: 1)其长尾数据分布导致罕见病症覆盖不足,评测结果存在偏差; 2)任务导向的设计聚焦疾病预测、用药咨询等单一场景,难以量化模型内在医学知识储量; 3)传统问答形式局限于表面对错判断,无法捕捉医学概念间的复杂拓扑关联。 为解决这 ...
评论 || 舱驾一体化下的几点思考
众所周知,传统的汽车控制系统普遍存在功能模块分割明显、跨域协作困难的问题。驾驶系统关注的是车辆操控安全,座舱系统则注重用户服 务体验,两者在系统架构和技术路径上一直存在较大差异,造成了用户体验不连贯甚至割裂的现象。比如:用户在驾驶过程中感到头晕,需要 打开车窗,同时想要靠边停车,这种看似简单的多任务协作,在以往独立设计的架构中往往难以实现平滑切换。 随着AI技术的广泛应用,特别是大语言模型(LLM)的引入,这种局面正在逐步改善。通过构建以中央智能大脑为核心的整车架构,能够有效 协调驾驶与座舱域,实现更好的跨域协作和数据共享。AI汽车时代的关键在于打通不同功能域之间的壁垒,打造真正意义上的智能座舱与智能 驾驶无缝融合。 近年来,随着汽车智能化和网联化技术的迅猛发展,"舱驾一体化"成为汽车行业热议的话题。这一趋势本质上是驾驶域与座舱功能域的深 度融合,其背后体现的是汽车产业从以驾驶员为核心的传统模式向以用户体验为中心的智能模式转型。如何实现驾驶与座舱之间的无缝协同, 已然成为车企亟需思考并解决的关键问题。 归根结底,"舱驾一体化"不是车企的一次炫技,而要为用户创造真正价值。只有打通驾驶与座舱之间的壁垒,实现从功能 ...
具身智能 “成长”的三大烦恼
21世纪经济报道记者 林典驰 深圳报道 今年以来,人形机器人的产业化进展飞速。 从春晚上"福兮"的精彩表演,到首届人形机器人半程马拉松中"天工"的首次冲线,一时间"街头巷尾"都 在讨论人形机器人。 要支撑人形机器人与环境感知交互,就离不开具身智能技术的持续突破。尤其是大语言模型 (LLM)、视觉语言模型(VLM)以及视觉语言动作端到端模型(VLA)等关键技术的迭代创新,显 著提升了机器人在交互感知和泛化能力方面的表现。 然而,具身智能前行之路并非坦途,在数据采集、机器人形态应用以及大小脑融合等方面仍面临诸多挑 战。 因此,厂商们正在从不同的领域切入,解决以上痛点。比如,英特尔和东土科技(300353)等提出大小 脑融合解决方案,采用单一芯片架构替代双系统模式,降低整体成本及软件开发、测试、优化与部署成 本。 破解数据匮乏桎梏 1950年,艾伦·图灵首次提出"具身智能"时,并未引起轰动,直到在近两年才成为科技圈的热词。 图灵给出的基本假设是,具身智能是通过与环境交互获得知识并泛化应用能力。英伟达创始人兼CEO黄 仁勋则进一步诠释,具身智能是能够理解、推理并与物理世界互动的智能系统,预计其将成为人工智能 的下一波 ...
我悟了如何与AI说话!谷歌 69 页官方提示词秘籍全解析,中文版免费下载
AI科技大本营· 2025-04-22 10:26
(You don't need to be a data scientist or a machine learning engineer – everyone can write a prompt.) 作者 | 王启隆 出品 | CSDN(ID:CSDNnews) 最近,Google 官方发布了一份长达 69 页的 【Prompt Engineering 白皮书】 ,可以说是目前最系统、最权威的"AI 沟通指南"了。我们也是第一时 间翻译好了这本书,准备 【免费】 送给大家! 怎么拿?很简单, 看完这篇文章,参与文末的小活动就行! 现在咱们聊聊,为啥这份白皮书突然就刷屏了?为啥说它是"必学秘籍"? 你不必是数据科学家或机器学习工程师——人人都可以编写提示词。 你苦口婆心解释半天,它抓着一个无关紧要的词就开始自由发挥…… 你想要个 A,它自信满满地给你个 B,还附赠一套又臭又长、看似完美的错误逻辑…… 同一个问题,昨天它懂你,今天它就装傻,效果全看"缘分"…… Google 这份白皮书,不是某个博主的心得体会,不是零散的技巧合集,而是 Google 官方基于对大语言模型(LLM)的深刻理解,系统性梳理出来的 ...
一堂「强化学习」大师课 | 42章经
42章经· 2025-04-13 12:02
吴翼: RL 是机器学习这个大概念下一类比较特殊的问题。 曲凯: 今天我们请来了国内强化学习 (RL) 领域的专家吴翼,吴翼目前是清华大学交叉信息研究院 助理教授,他曾经在 OpenAI 工作过,算是国内最早研究强化学习的人之一,我们今天就争取一 起把 RL 这个话题给大家聊透。 首先吴翼能不能简单解释一下,到底什么是 RL? 传统机器学习的本质是记住大量标注过正确答案的数据对。 举个例子,如果你想让机器学习能分辨一张图片是猫还是狗,就要先收集 10000 张猫的照片和 10000 张狗的照片,并且给每一张都做好标注,让模型背下来。 上一波人工智能四小龙的浪潮其实都以这套框架为基础,主要应用就是人脸识别、指纹识别、图 像识别等分类问题。 这类问题有两个特点,一是单一步骤,比如只要完成图片分辨就结束了;二是有明确的标准答 案。 但 RL 很不一样。 RL 最早是用来打游戏的,而游戏的特点和分类问题有两大区别。 第一,游戏过程中有非常多的动作和决策。比如我们玩一个打乒乓球的游戏,发球、接球、回 球,每一个动作都是非标的,而且不同的选择会直接影响最终的结果。 第二,赢得一场游戏的方式可能有上万种,并没有唯一的标准答 ...
一堂「强化学习」大师课 | 42章经
42章经· 2025-04-13 12:01AI Processing
曲凯: 今天我们请来了国内强化学习 (RL) 领域的专家吴翼,吴翼目前是清华大学交叉信息研究院助理教 授,他曾经在 OpenAI 工作过,算是国内最早研究强化学习的人之一,我们今天就争取一起把 RL 这个话题 给大家聊透。 举个例子,如果你想让机器学习能分辨一张图片是猫还是狗,就要先收集 10000 张猫的照片和 10000 张狗 的照片,并且给每一张都做好标注,让模型背下来。 首先吴翼能不能简单解释一下,到底什么是 RL? 上一波人工智能四小龙的浪潮其实都以这套框架为基础,主要应用就是人脸识别、指纹识别、图像识别等 分类问题。 吴翼: RL 是机器学习这个大概念下一类比较特殊的问题。 传统机器学习的本质是记住大量标注过正确答案的数据对。 所以我觉得人生有一个很好玩的地方是,你需要花很多时间先探索自己的奖励函数是什么,很多人可能努 力了很长时间,最后却发现找错了奖励函数。 这类问题有两个特点,一是单一步骤,比如只要完成图片分辨就结束了;二是有明确的标准答案。 但 RL 很不一样。 RL 最早是用来打游戏的,而游戏的特点和分类问题有两大区别。 第一,游戏过程中有非常多的动作和决策。比如我们玩一个打乒乓球的游戏, ...