Workflow
瞬悉1.0
icon
Search documents
AI大牛张祥雨:Transformer撑不起Agent时代
Di Yi Cai Jing· 2025-12-18 10:52
人脑是"无限流"压缩大师,大模型靠堆层数无法学会人类记忆,到8万Token就不可用了。 "但是很快我们发现了一个巨大的副作用。"张祥雨说,真正的难点是模型的智商会随着文本变化快速下降。"今天的Transformer,不管号称发布出来说支持 到多少Token,基本上到8万个就不可用了。" 这个问题指向了Transformer的一个缺陷,就是它的单向信息流设计。无论输入序列(Context)多长,模型的有效"思考深度"的信息只能从浅层向深层单向 传递,缺乏从深层向浅层的反馈与压缩机制,这与人类大脑"无限流"的记忆机制存在本质差异。 "我今天讲过的每一句话,都是历史上我见过的所有信息的函数。"张祥雨用比喻阐明,"这个函数能用层数固定的网络来表示吗?肯定不可以。"他说人类大 脑能够对从小到大的海量经历进行动态压缩和选择性回溯,而当前Transformer结构无法实现这种类似"无限流"世界的智能处理需求,这制约了AI向具备高度 自主性、能长期持续学习的通用Agent演进。 事实上,当前已经开始有研究者讨论Transformer是否存在根本局限性。就在今年10月,Transformer 架构的共同创造者Llion Jon ...
与沐曦打通GPU算力平台,AI让脑机接口更近了
3 6 Ke· 2025-12-16 03:11
"人脑以仅约20瓦的功耗支撑起千亿级神经元的复杂运作,这为AI提供了极致的能效范例。借鉴人脑机制将成为突破 低功耗、长序列与通用性三大核心难题的关键。" 在"从脑机接口到脑机共生"主题论坛期间,在接受《科创板日报》等媒体采访时,对于AI与脑机接口融合的下一步发 展方向,中国科学院自动化所研究员李国齐如是阐述。 在这场会议上,天桥脑科学研究院研究院创始人雒芊芊宣布天桥脑科学研究院成立尖峰智能实验室,由李国齐团队研 发的国内首款类脑脉冲大模型"瞬悉1.0"也同步亮相。该模型在国产GPU算力平台上完成训练与推理,并与国产GPU企 业沐曦科技协同,打通了从类脑基础模型、国产算力平台到类脑芯片的全栈式研究链条。 打通国产GPU算力平台 "瞬悉1.0"被视为我国类脑计算与大模型融合的一次关键突破。该模型由李国齐团队研发,是国内首个类脑脉冲大模 型。与当前主流基于Transformer架构的大模型不同,类脑模型借鉴人脑以脉冲形式进行信息传递和处理的机制,试图 从根本上破解高能耗、长序列建模和泛化能力受限等问题。 李国齐向《科创板日报》等媒体介绍,发现式智能的一个关键能力是神经动力学。人脑以仅约20瓦的功耗支撑起千亿 级神经 ...
半导体早参 | 沐曦股份将于12月17日上市,壁仞科技将赴港上市
Mei Ri Jing Ji Xin Wen· 2025-12-16 01:33
2025年12月15日,截至收盘,沪指跌0.55%,报收3867.92点;深成指跌1.10%,报收13112.09点;创业 板指跌1.77%,报收3137.80点。科创半导体ETF(588170)跌1.41%,半导体材料ETF(562590)跌 0.50%。 隔夜外盘:截至收盘,道琼斯工业平均指数跌0.09%;纳斯达克综合指数跌0.59%;标准普尔500种股票 指数跌0.16%。费城半导体指数跌0.61%,恩智浦半导体涨1.61%,美光科技跌1.51%,ARM跌4.98%, 应用材料涨0.79%,微芯科技收平。 行业资讯: 半导体材料ETF(562590)及其联接基金(A类:020356、C类:020357),指数中半导体设备 (61%)、半导体材料(21%)占比靠前,充分聚焦半导体上游。 1. 沐曦股份12月15日公告,公司股票将于2025年12月17日在上海证券交易所科创板上市。根据《上海证 券交易所科创板上市公司自律监管指引第5号——科创成长层》,上市时未盈利的科创板公司,自上市 之日起纳入科创成长层。截至本公告披露日,沐曦股份尚未盈利,自上市之日起将纳入科创成长层。 2. 中国证监会国际合作司发布关于 ...
天桥脑科学研究院宣布成立尖峰智能实验室
Xin Hua Cai Jing· 2025-12-13 12:29
打造发现式智能的关键能力 在 2025 年 AI 驱动科学研讨会上,天桥脑科学研究院创始人陈天桥首提"发现式智能(Discoverative Intelligence)"理念,尖峰智能实验室正是这一理念的重 要落地载体之一。 图为盛大集团、天桥脑科学研究院创始人 陈天桥、雒芊芊夫妇 新华财经上海12月13日电(谷青竹、邓侃) 12 月 13 日,在天桥脑科学研究院主办的"从脑机接口到脑机共生"主题论坛暨中国神经科学学会脑机接口与交互 分会年会上,研究院创始人雒芊芊宣布:天桥脑科学研究院成立尖峰智能实验室(Spiking Intelligence Lab, SIL),致力于类脑大模型和脉冲神经网络的研 发,探索人工智能与人类智慧的深度融合。该非营利研究机构由中国科学院自动化研究所研究员李国齐领衔。 尖峰智能实验室的成立,标志着研究院在原有"外延式"捐赠支持的基础上,进一步增强"内部自主"的专项研发。尖峰智能实验室是研究院首个采用 In-House 模式的研究机构,直接招募顶尖人才、自主决定研发方向,将角色从合作赋能者升级为创造主体,加速"发现式智能"从理念到基础理论突破再到技术成果的 转化。 图为天桥脑科学研究 ...
天桥脑科学研究院成立尖峰智能实验室 支持“发现式智能”
Di Yi Cai Jing· 2025-12-13 08:28
12月13日,在中国神经科学学会脑机接口与交互分会年会上,天桥脑科学研究院宣布成立尖峰智能实验 室(Spiking Intelligence Lab, SIL),致力于类脑大模型和脉冲神经网络的研发,探索人工智能与人类智 慧的深度融合。 第一财经记者从会议现场了解到,最新成立的尖峰智能实验室属于非营利研究机构,由中国科学院自动 化研究所研究员李国齐教授领衔,目标是为打造天桥脑科学研究院创始人陈天桥提出的"发现式智能"提 供关键能力。 李国齐对第一财经记者表示:"发现式智能的一个关键能力是神经动力学。不同于当前依赖规模法则堆 叠参数的主流AI模式,尖峰智能实验室主张借鉴人脑这一自然界最精巧的智能载体,重点研发具有神 经动力学特性的类脑大模型,将脉冲通信、时空动态编码等计算特性与树突神经元的精细结构深度耦 合,构建一个既具备强大感知力,又拥有深刻记忆与思考能力的全脑架构。" 这一路径也是陈天桥此前提出的实现通用人工智能的"结构路径"。人脑以仅约20瓦的功耗支撑起千亿级 神经元的复杂运作,李国齐从事的脉冲神经网络和类脑大模型的研究,将为构建这样的全脑架构提供基 础研究及转化方面的支持。 陈天桥最近提出,仅靠数据和算 ...
天桥脑科学研究院成立尖峰智能实验室,支持“发现式智能”
Di Yi Cai Jing· 2025-12-13 08:23
尖峰智能实验室主张借鉴人脑这一自然界最精巧的智能载体,重点研发具有神经动力学特性的类脑大模型,构建一个既 具备强大感知力,又拥有深刻记忆与思考能力的全脑架构。 12月13日,在中国神经科学学会脑机接口与交互分会年会上,天桥脑科学研究院宣布成立尖峰智能实验室(Spiking Intelligence Lab, SIL),致力于类脑大模型和脉冲神经网络的研发,探索人工智能与人类智慧的深度融合。 第一财经记者从会议现场了解到,最新成立的尖峰智能实验室属于非营利研究机构,由中国科学院自动化研究所研究员 李国齐教授领衔,目标是为打造天桥脑科学研究院创始人陈天桥提出的"发现式智能"提供关键能力。 李国齐对第一财经记者表示:"发现式智能的一个关键能力是神经动力学。不同于当前依赖规模法则堆叠参数的主流AI 模式,尖峰智能实验室主张借鉴人脑这一自然界最精巧的智能载体,重点研发具有神经动力学特性的类脑大模型,将脉 冲通信、时空动态编码等计算特性与树突神经元的精细结构深度耦合,构建一个既具备强大感知力,又拥有深刻记忆与 思考能力的全脑架构。" 这一路径也是陈天桥此前提出的实现通用人工智能的"结构路径"。人脑以仅约20瓦的功耗支撑起 ...
AI产业跟踪:MiniMax启动全员期权激励,阿里发布Qwen3-Max-Preview
Investment Rating - The report does not explicitly provide an investment rating for the AI industry Core Insights - The AI industry is experiencing significant advancements with major companies launching new models and tools, indicating a competitive landscape and innovation drive [1][3][4][5][6][7][8][9][10][11][12][13][14] Summary by Sections 1. AI Industry Dynamics - The 2025 Bund Conference was held in Shanghai, featuring 550 guests from 16 countries, discussing innovation and the future of business in the AI era [3] - Richard Sutton emphasized the importance of continuous learning and decentralized collaboration in AI's "experience era" [3] 2. AI Application News - ByteDance launched the Dream Image 4.0 model, which excels in image generation and editing, supporting up to 4K resolution and offering various creative functionalities [5] 3. AI Large Model News - Tencent introduced CodeBuddy Code, an AI CLI tool that automates the software development lifecycle, reducing coding time by an average of 40% [6] - Alibaba released Qwen3-Max-Preview, a large-scale model with over 1 trillion parameters, outperforming competitors in various benchmarks [7][8] - WALL-OSS, a general-purpose intelligent model, was released and open-sourced, showcasing strong capabilities in reasoning and task planning [9] - The "SpikingBrain-1.0" model was developed, achieving high efficiency with significantly less data compared to traditional models [10] - Baidu's Wenxin X1.1 model showed improvements in factuality and instruction adherence, enhancing its capabilities in complex tasks [11] 4. Technology Frontiers - The SAIL-Recon project from Hong Kong University and Horizon team demonstrated advancements in visual localization and 3D reconstruction using transformer architecture [14]