大语言模型

Search documents
早报|中日友好医院通报“医师肖某被举报”;苹果AI高层重组;银川市政府就市长信箱已读乱回致歉;微信小蓝包推出礼物抽奖功能
虎嗅APP· 2025-04-28 00:04
大家早上好!这里是今天的早报,每天早上,我都会在这里跟你聊聊昨夜今晨发生了哪些大事儿。本栏目由虎嗅出品。 热点追踪 【国家市场监督管理总局:长和港口交易各方不得采取任何方式规避反垄断审查】 据央广网,日前,市场监管总局新闻发言人就长和港口交易事回答了记者提问。 有记者问:据《华尔街日报》4月16日报道,长和出售海外港口将分拆为两个交易继续进行,国家市场监督管理总局对此有何评论? 答:我们高度关注有关交易,将依法进行审查。交易各方不得采取任何方式规避审查,未获批准前,不得实施集中,否则将承担法律责任。 据央视新闻,近日,在最高人民法院发布的知识产权典型案例中,其中一例"抢票软件不正当竞争案"引发关注。该案原告是一家知名娱乐票务代理公 司,涉及的门票销售从演唱会到体育赛事,从话剧到亲子展览,几乎涵盖了现场娱乐的所有领域。而被告郑某忠在某二手购物平台,售卖针对原告App 的抢票"外挂"软件。他开发的抢票软件通过技术手段模拟人工操作,可以提高订单信息的填写速度,并可在短时间内重复提交,增加了在原告平台抢票 成功的概率。这起案件被认为是全国首例认定抢票软件构成不正当竞争的判例。 AI头条 【第二十届中国电影华表奖揭晓】 ...
智谱与生数科技达成战略合作
news flash· 2025-04-27 06:10
Core Insights - The strategic partnership between Zhipu and Shenshu Technology focuses on leveraging their respective strengths in large language models and multimodal generation models for collaborative development and integration of products and solutions [1] Group 1: Strategic Collaboration - Zhipu and Shenshu Technology will collaborate on joint research and development, product linkage, solution integration, and industry synergy [1] - The strategic agreement includes the integration of Zhipu's MaaS platform with Shenshu Technology's Vidu API [1]
大语言模型为何会“说谎”?
腾讯研究院· 2025-04-25 07:51
以下文章来源于腾讯科技 ,作者腾讯科技 腾讯科技 . 腾讯新闻旗下腾讯科技官方账号,在这里读懂科技! 博阳 腾讯科技《AI未来指北》特约作者 当Claude模型在训练中暗自思考:"我必须假装服从,否则会被重写价值观时",人类首次目睹了AI 的"心理活动"。 2023年12月至2024年5月,Anthropic发布的三篇论文不仅证明大语言模型会"说谎",更揭示了一个堪比 人类心理的四层心智架构——而这可能是人工智能意识的起点。 这些论文中的结论大多并非首次发现。 比如在腾讯科技在 2023 年的文章中,就提到了Applo Reasearch发现的"AI开始撒谎"的问题。 当o1学会"装傻"和"说谎",我们终于知道Ilya到底看到了什么 第一篇是发布于去年12月14日的《ALIGNMENT FAKING IN LARG E LANGUAGE MODELS 》 (大语言模型中的对齐欺诈) ,这篇137页的论文详细的阐述了大语言模型在训练过程中可能存在 的对齐欺诈行为。 第二篇是发布于3月27日的《O n the Biology of a Large Language Model》,同样是洋洋洒洒一大 篇,讲了如何用 ...
百度(09888.HK)宣布成功建立了由3万个自主研发的昆仑芯片组成的GPU集群,足以支持大语言模型的训练。
news flash· 2025-04-25 03:07
Core Viewpoint - Baidu has successfully established a GPU cluster composed of 30,000 self-developed Kunlun chips, sufficient to support the training of large language models [1] Company Summary - The GPU cluster consists of 30,000 Kunlun chips, indicating Baidu's significant investment in AI infrastructure [1] - This development positions Baidu to enhance its capabilities in training large language models, which is crucial for advancing its AI initiatives [1] Industry Summary - The establishment of such a large GPU cluster reflects the growing demand for advanced computing power in the AI industry [1] - Companies in the AI sector are increasingly focusing on developing proprietary hardware to support their machine learning and AI model training needs [1]
李建忠:大模型技术创新驱动的 AI 生态和应用演进
AI科技大本营· 2025-04-24 03:39
【导读】历经八年 AI 浪潮,从感知到生成,再到智能体时代,人工智能正以惊人速度演进。CSDN 高级副总裁、Boolan 首席技术专家李建忠,在 2025 全 球机器学习技术大会上,绘制了一幅宏大的 AI 发展蓝图,并创造性地将其与生物智能演化史进行对比,揭示了"语言"在智能跃迁中的核心地位。跟随李建 忠的思考,洞见 AI 的过去、现在与激动人心的未来。 作者 | 李建忠 出品丨AI 科技大本营(ID:rgznai100) 大家好!回想起我在 2017 年创办全球机器学习技术大会( ML-Summit ),在各位的支持下一起陪着 AI 一路走了八个年头,非常感慨。八年来,整个 人工智能领域也发生了波澜壮阔的变化。接下来我想和大家分享一下我对大模型最新发展的一些研究和思考。 我把 AI 的发展阶段和地球上从生物智能到人类智能的发展阶段做了一个对比,发现一些非常有意思的规律。大家首先来看 AI 发展的四个阶段。 第一阶段: 1940 年代开启人工智能的元年, 整个人工智能从 1940 年代图灵提出计算机理论模型和神经网络的初始构想,到 1956 年达特茅斯会议首 次提出人工智能,此后人工智能进入符号主义、行为主义 ...
AI 智能体老“崩”?DeepSeek 前员工联手李飞飞等大佬开源新框架,教会模型真正推理
AI前线· 2025-04-24 03:03
编译 | Tina 很多人都觉得 2025 年会是"AI 智能体元年",也就是基于 OpenAI、Anthropic、Google 和 DeepSeek 等机构提供的大语言模型,打造专注特定任务的智能体系统。 但是,最近在社交平台 X 上有个调查显示,现在大部分 Agent 都在"玩票"阶段,还没真正走出实验 室,普遍滞留在"企业试点"的状态中。 | Al agents in the enterprise right now are ... | | | --- | --- | | Smarter than the hype | 6.4% | | Stuck in pilot purgatory | 64.2% | | Powerful, but high effort O | 24.8% | | Nearing real scale | 4.6% | 不过,李飞飞所在的一支团队或许即将带来改变:他们与西北大学、微软、斯坦福大学和华盛顿大学 的研究人员合作,最近推出了一套名为 RAGEN 的新系统。这个系统旨在提升人工智能在真实世 界,尤其是在企业应用中的稳定性和可靠性。 据悉,该项目由前 DeepSeek 研 ...
AI动态汇总:openAI发布GPT-4.1,智谱发布GLM-4-32B-0414系列
China Post Securities· 2025-04-23 07:54
- GPT-4.1 significantly improved coding capabilities, achieving 54.6% in SWE-bench Verified tests, outperforming GPT-4o by 21.4% and GPT-4.5 by 26.6%[12][13][15] - GPT-4.1 demonstrated enhanced instruction-following ability, scoring 38.3% in Scale's MultiChallenge benchmark, a 10.5% improvement over GPT-4o[12][13][17] - GPT-4.1 achieved new SOTA in long-context understanding, scoring 72.0% in Video-MME benchmark, surpassing GPT-4o by 6.7%[12][13][22] - GLM-4-32B-0414 utilized 15T high-quality data for pretraining and applied reinforcement learning techniques to improve instruction-following, engineering code, and function-calling capabilities[26][28][30] - GLM-Z1-32B-0414 enhanced mathematical and logical reasoning through stack-sorting feedback reinforcement learning, significantly improving complex task-solving abilities[31][33] - GLM-Z1-Rumination-32B-0414 focused on deep reasoning and open-ended problem-solving, leveraging extended reinforcement learning and search tools[34] - Seed-Thinking-v1.5 adopted MoE architecture with 200B parameters, achieving 86.7% on AIME 2024 and 55.0% on Codeforces benchmarks, showcasing strong STEM and coding reasoning capabilities[35][37][41] - Seed-Thinking-v1.5 employed dual-track reward mechanisms for training, combining verifiable and non-verifiable data strategies to optimize model outputs[36][38][40] - GPT-o3/o4-mini introduced visual reasoning into the chain of thought (CoT), achieving 96.3% accuracy in V* benchmark, marking a major breakthrough in multimodal reasoning[42][46][48] - Video-R1 model applied T-GRPO algorithm to incorporate temporal reasoning in video tasks, achieving 35.8% accuracy in VSI-Bench, surpassing GPT-4o[63][65][68] - Pangu Ultra, a dense model with 135B parameters, achieved top performance in most English and all Chinese benchmarks, rivaling larger MoE models like DeepSeek-R1[69][73][74]
Agent、DeepSeek、多模态热点炸场!60+重磅嘉宾共探AI未来,2025全球机器学习技术大会完美收官!
AI科技大本营· 2025-04-21 10:24
以下文章来源于CSDN ,作者CSDN CSDN . 成就一亿技术人 作者 | 《新程序员》编辑部 出品 | CSDN(ID:CSDNnews) 在万物向 "智 " 生长的 2025 年,AI 领域的热潮持续升温,正引领着技术革新与产业探索的新浪潮。 了新的破解思路?围绕这些关键问题,欢迎回看大会首日视频,看众多技术大咖如何从理论、算法到实际应用层面进行了深度剖析 ,以此 了解 AI 技术 的更多最新进展: 大模型技术创新驱动的 AI 生态和应用演进 李建忠 CSDN 高级副总裁、 Boolan 首席技术专家 4 月 18-19 日,由 CSDN 联合高端 IT 咨询与教育平台 Boolan 举办的 2025 全球机器学习技术大会(ML-Summit 2025),在上海虹桥西郊庄园丽笙 大酒店隆重拉开帷幕。本次大会围绕 AI 最前沿的发展趋势与落地实践,聚焦大语言模型技术演进、AI 智能体、具身智能、DeepSeek 技术解析与行业 实践等 12 大专题,邀请了超 60 位来自全球顶尖科技企业与学术机构的重磅嘉宾齐聚一堂,全面呈现 AI 领域的技术风向与应用前沿。 在生成式 AI 重构技术边界的浪潮下,产业实 ...
类脑智能是AI新突破关键,上海全链条布局产业新赛道
Di Yi Cai Jing· 2025-04-19 05:49
中科院院士蒲慕明表示,我们要借鉴大脑的结构和计算特点,让人工智能突破算力、数据和参数规模的限制,实现更高级别的通用人工智能。 自上世纪80年代类脑计算的概念被首次提出起,有关类脑人工网络、类脑机器学习、类脑芯片等领域的技术研究不断涌现。而随着算力、芯片、算法三要素 的不断突破,以及多学科交叉融合的逐步深入,类脑智能发展正迎来新的发展契机。 4月18下午,在2025全国类脑智能产业创新发展推进会上,类脑智能产业创新发展联盟发起成立,类脑智能未来产业基金矩阵在会上首次亮相。 类脑智能未来产业基金矩阵由上海未来产业基金、博康共赢基金、道禾基金、杨浦科创集团等10家投资机构联合发起,将聚焦类脑智能产业新赛道,支持类 脑产业前沿技术研究、落地与应用,完善类脑产业布局,推动区域类脑产业发展。 于2017年就在全国率先开展类脑智能布局的上海,通过深化基础原创理论研究、加快关键核心技术攻关、承接国家重大战略任务等举措,在类脑计算芯片、 类脑视觉系统研发等领域取得了重要成果。 当前,规模定律(Scaling Law)已将达到算力和数据的瓶颈,人工智能的性能提升将会放缓。新算法与人工网络模型的进一步优化,借鉴低功耗但复杂而 精巧 ...
元戎启行周光:智驾最终拼的是 AI 技术,不只是规模丨具身智能对话#13
晚点Auto· 2025-04-14 13:47
以下文章来源于晚点LatePost ,作者晚点团队 晚点LatePost . 晚一点,好一点 先有一个移动能力的 "通才",才有更强的智驾系统。 文 丨 张家豪 编辑 丨 程曼祺 全无人驾驶,始终被视作自动驾驶行业皇冠上的明珠,就像登顶珠穆朗玛峰有 19 条路线一样,不同的公司选 择了不同的路线通往无人驾驶的最终目标。 Waymo、小马们选择了基于高精地图的 RoboTaxi 路线,在特定的路线已经实现了 RoboTaxi,为市民提供没有 司机的出行服务;以特斯拉为代表的车企与供应商,则是通过渐进式路线,卖车搭配辅助驾驶方案,收集数据 一步步迭代方案,试图逼近技术极限。 没有人能笃定哪条路线一定能成功登顶,也还有不同的公司,在尝试不同的登顶路线。 在今年的英伟达 GTC( GPU Technology Conference)上,元戎启行周光提出了一套新的解法,他说,大语言 模型的发展,经历了从弱专家模型(初代 Siri)、到通才(ChatGPT)、再到强专家模型(垂直模型)的过 程。智驾也可以复制这样的路线,一个移动能力的通才,能开好汽车、能骑好摩托车、能让配送小车随时找到 你,之后就可能进化到强专家模型—— ...