深度学习

Search documents
DLC中国深度学习年会正式发布!AI与PBL引领课堂创新
Nan Fang Du Shi Bao· 2025-07-12 05:41
HTH PBL Design Camp培训现场。 广州优联学校中方校长常燕在会议上分享了该校在PBL实践中的探索。她提到,优联将PBL系统性地融 入课程体系,例如在G9-G10设置必修课,并创建CTB全球青年创新项目社团。学生通过解决真实问 题,如设计环保方案、分析社区经济问题等,打破学科壁垒,培养跨学科能力。 随后,美国HTH深度学习中心主任Mari Jones介绍了深度学习年会备受关注的重点项目,即"深潜工作 坊"。这些工作坊为教育者提供一整天的沉浸式学习体验,涵盖AI辅助设计、跨学科项目实践等内容。 部分已确认的工作坊包括"HTH研究生院的AI辅助项目设计""Spark Curiosity GPT教练""定制化聊天机器 人"等。 7月10日,2025年中国深度学习年会暨第三期优联论坛线上发布会举行。本次发布会由DLC深度学习中 心主办,广州优联学校协办。南都记者从会上获悉,会议聚焦"AI与PBL引领课堂创新"这一主题,深入 探讨了人工智能(AI)与项目式学习(PBL)如何共同推动教育变革,培养未来社会所需的创新型人 才。 2025年中国深度学习年会暨第三期优联论坛线上发布会。 会上,DLC深度学习中心创 ...
Meta为他豪掷2亿美元,上交校友庞若鸣,晒出在苹果的最新论文
机器之心· 2025-07-10 10:49
机器之心报道 编辑:笑寒、陈陈 这或许是庞若鸣(Ruoming Pang)在苹果参与的最后一篇论文。 庞若鸣 ,苹果基础模型团队负责人、杰出工程师,即将成为 Meta 新成立的超级智能团队的最新成员。他本科毕业于上海交通大学,在谷歌工作了 15 年,此后加 入苹果。另据彭博社最新消息,Meta 更是开出了 2 亿美金的天价来邀请庞若鸣加入。 虽然即将跨入另一段人生旅程,但庞若鸣还在为苹果站好最后一班岗。 7 月 9 日,庞若鸣在 X 上宣传了自己参与的一项研究《 AXLearn: Modular Large Model Training on Heterogeneous Infrastructure 》,据了解,这项研究是构建 Apple Foundation 模型的基础代码库。 具体而言,本文设计并实现了 AXLearn ,一个用于大规模深度学习模型训练的生产级系统,其具备良好的可扩展性和高性能。与其他先进的深度学习系统相比, AXLearn 具有独特的优势: 高度模块化和对异构硬件基础设施的全面支持 。 AXLearn 内部的软件组件接口遵循严格的封装原则,使得不同组件能够灵活组合,从而在异构计算环境中快 ...
浙江大学最新Cell论文:AI基因组模型——女娲CE,破译脊椎动物基因组调控语言
生物世界· 2025-07-09 00:09
撰文丨王聪 编辑丨王多鱼 排版丨水成文 多细胞生物中的不同细胞类型拥有相同的基因组,但由于基因表达的差异调控,它们表现出高度特化的功能特征。调控序列通过以细胞类型特异性的方式招募序 列特异性转录因子 (TF) 来决定基因表达模式。染色质可及性是调控 DNA 的通用标志,可通过 DNA 酶 I 超敏感性测序 (DNase-seq) 和基于转座酶可及染 色质测序(ATAC-seq)进行测量。利用这些检测方法,已经在哺乳动物中开展了多项大规模工作以绘制全基因组范围内的调控序列。然而,对于大多数物种而 言,全面的细胞类型解析调控序列图谱仍不可用。 该研究建立了 超高通量、超灵敏的单核 ATAC 测序技术 (UUATAC-seq) ,可在一天内高效率高质量的完成一个物种的染色质可及性图谱。基于该技术,研究 团队为五大代表性脊椎动物中绘制候选顺式调控元件图谱,开发了多任务深度学习模型—— 女娲CE ( Nvwa cis -regulatory element ) ,并实现了从基因组序 列到单细胞水平调控元件图谱的直接预测。 研究团队发现,脊椎动物调控语法的保守性明显强于核苷酸序列本身,且该语法将脊椎动物调控原件序列在高维 ...
LeCun团队揭示LLM语义压缩本质:极致统计压缩牺牲细节
量子位· 2025-07-04 01:42
时令 发自 凹非寺 量子位 | 公众号 QbitAI 当我们读到"苹果""香蕉""西瓜"这些词,虽然颜色不同、形状不同、味道也不同,但仍会下意识地归为"水果"。 哪怕是第一次见到"火龙果"这个词,也能凭借语义线索判断它大概也是一种水果。 这种能力被称为 语义压缩 ,它让我们能够高效地组织知识、迅速地对世界进行分类。 那问题来了:大型语言模型(LLM)虽然语言能力惊人,但它们在语义压缩方面能做出和人类一样的权衡吗? 为探讨这一问题, 图灵奖得主LeCun团队 ,提出了一种全新的信息论框架。 该框架通过对比人类与LLM在语义压缩中的策略,揭示了两者在压缩效率与语义保真之间的根本差异: LLM偏向极致的统计压缩,而人类更重细节与语境。 语义压缩对比框架 要实证性地研究LLM的表征方式与人类概念结构之间的关系,需要两个关键要素: 稳健的人类概念分类基准 研究团队基于认知科学中的三项经典研究(Rosch 1973、1975和McCloskey & Glucksberg 1978),构建了一个涵盖 1049个项目、34个 语义类别 的统一基准。 这些数据不仅提供了类别归属信息,还包含人类对各项目"典型性"的评分,反映了人 ...
你被哪个后来知道很致命的BUG困扰过一周以上吗?
自动驾驶之心· 2025-07-03 12:41
作者 | hzwer 黄哲威 编辑 | 自动驾驶之心 原文链接: https://www.zhihu.com/question/535225379/answer/1919097852895958495 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 本文只做学术分享,如有侵权,联系删文 来点强化学习笑话 鼓励一个走迷宫 AI 尽量去那些没见过的场景,结果 AI 找到了一个迷宫里的电视,不用动就能不断地 见到新东西 《智能体只想看电视》 模型训练很慢,随便写点 bug 很多天以后才会观察到迹象 我入门强化学习做的项目 NIPS2017-LearningToRunACE,是在虚拟环境训练一个机器人跑步,要在规定时 间跑得最远,模型输入就是各个机器人关节的速度位置,障碍物的位置等等,然后输出肌肉的舒张收缩控 制量 当年强化学习搭好框架以后,基本上就是要设计奖励或者说学习目标 先写个速度最快的学习目标 -> 学了两天一看,模型学会了跳远然后摔倒,因为蹦出去那一下挺快的摔倒惩 罚搞高点 -> 模型学会扎马步 换个惩 ...
中美AI差距有多大,AI竞争焦点在哪?《全球人工智能科研态势报告》全球首发
Tai Mei Ti A P P· 2025-07-03 10:36
Core Insights - The report titled "Global AI Research Landscape Report (2015-2024)" analyzes the evolution of AI research over the past decade, highlighting the competitive landscape between China and the United States in AI talent and publication output [2][7]. Group 1: AI Research Trends - The report identifies four distinct phases in AI research: initial phase (2015-2016), rapid development phase (2017-2019), maturity peak phase (2020-2023), and adjustment phase (2024) [4][5]. - The number of AI papers published globally increased significantly, with a peak of 17,074 papers in 2023, representing nearly a fourfold increase from 2015 [5][6]. - The year 2024 is expected to see a decline in publication volume to 14,786 papers, indicating a shift towards more specialized and application-oriented research [6]. Group 2: Talent Distribution - China has emerged as the second-largest hub for AI talent, with a total of 52,000 researchers by 2024, growing at a compound annual growth rate of 28.7% since 2015 [8]. - The United States leads with over 63,000 AI researchers, with significant contributions from institutions like Stanford and MIT, as well as tech giants like Google and Microsoft [8][9]. - Chinese institutions such as the Chinese Academy of Sciences, Tsinghua University, and Peking University are leading in terms of publication output and talent concentration [7][9]. Group 3: Institutional and Corporate Performance - The Chinese Academy of Sciences published 4,639 top-tier papers, while Tsinghua University and Peking University followed closely, showcasing China's institutional strength in AI research [7][9]. - In contrast, U.S. companies like Google, Microsoft, and Meta have a significantly higher average publication output compared to their Chinese counterparts, reflecting a disparity in research investment and output capabilities [9][10]. - The top three U.S. companies published 5,896 papers, which is 1.8 times the output of the top three Chinese companies [9][10]. Group 4: Gender Disparity in AI Talent - The report highlights a significant gender imbalance in AI research, with women making up only 9.3% of AI talent in China compared to 20.1% in the U.S. [12][13]. - Chinese institutions like Tsinghua University and Peking University have low female representation in AI, at 7.88% and 9.18% respectively, compared to 25%-30% in top U.S. institutions [12][13]. Group 5: Future Trends in AI Research - The report indicates that "deep learning" has been the dominant focus in AI research over the past decade, but its growth rate is expected to slow down, suggesting a need for new approaches [14][15]. - Emerging technologies such as "Transformers" are gaining traction, particularly in natural language processing and multimodal AI, indicating a shift in research focus [15]. - The integration of traditional AI fields with deep learning techniques is becoming more prevalent, reflecting a trend towards collaborative and interdisciplinary research [15].
李飞飞最新YC现场访谈:从ImageNet到空间智能,追逐AI的北极星
创业邦· 2025-07-02 09:49
来源丨Web3天空之城( Web3SkyCity ) 著名AI科学家李飞飞 这一次在YC创业学院峰会的最新访谈深入探讨了她的职业生涯与前瞻思考。她 分享了创办ImageNet,这一引爆深度学习革命的关键项目的幕后故事,并阐述了计算机视觉从物体 识别到场景叙事,再到她当前所专注的"空间智能"的演进路径。 李飞飞认为,理解和交互于三维世界是实现通用人工智能不可或缺的一环,并为此创立了World Labs。访谈还触及了她的个人经历,从移民少年到创办洗衣店,再到成为顶尖学者和企业家的历程, 强调了"智识上的无畏"是推动创新和个人成长的核心动力。 核心观点 ImageNet的诞生与深度学习的黎明 李飞飞 : 我整个职业生涯都在追逐那些极其困难,近乎妄想的问题。对我来说,没有空间智能的AGI 是不完整的。我想解决这个问题。我就是喜欢当企业家。忘记你过去所做的一切。忘记别人对你的看 法。埋头苦干,努力建设。那是我的舒适区。 主持人 : 所以,我非常兴奋能邀请到李飞飞博士。她在人工智能领域有着非常长的职业生涯。 我相信你们很多人都认识她,对吧?请举手。我也认识。她被称为人工智能教母。飞飞你创建的第一 个项目之一是2009年的 ...
重磅直播!清华&博世开源SOTA性能纯血VLA:Impromptu-VLA告别双系统~
自动驾驶之心· 2025-07-01 12:58
论文链接:https://arxiv.org/abs/2505.23757v1 对于想入门的同学,建议扎实深度学习和计算机视觉基础,逐步了解自动驾驶各模块。多阅读前沿论文,并通过 开源项目动手实践,熟悉数据处理和模型训练流程。希望能为大家带来启发,期待与大家交流。 数据集pipeline: >>直播和内容获取转到 → 自动驾驶之心知识星球 项目主页:https://github.com/ahydchh/Impromptu-VLA 当前自动驾驶系统在城市和高速公路等结构化环境中取得了显著进展,但面对乡村小路、临时施工区、非标准交 通规则以及恶劣路况等"非结构化场景"时,其鲁棒性和安全性仍面临严峻挑战。现有大规模自动驾驶数据集主要 侧重于常规交通状况 ,导致在这些复杂多变的非结构化环境中缺乏专门的、大规模且精细标注的数据。为了弥 补这一关键空白,清华AIR联合博世中央研究院 提出并构建了 Impromptu VLA 框架,旨在提供一个开放权重和 开放数据的驾驶视觉-语言-动作模型。Impromptu VLA 是一个完全端到端、无中间感知表征的"纯血VLA"系统, 其从驾驶视频片段中直接提取多模态特征,并生成自然语 ...
高频选股因子周报:高频因子上周表现分化,日内收益与尾盘占比因子强势。深度学习因子依然稳健, AI 增强组合上周表现有所分化。-20250629
GUOTAI HAITONG SECURITIES· 2025-06-29 11:24
| 高频选股因子周报(20250623- | [Table_Authors] | 郑雅斌(分析师) | | --- | --- | --- | | 20250627) | | 021-38676666 | | 高频因子上周表现分化,日内收益与尾盘占比因子强势。深度 | 登记编号 | S0880525040105 | | 学习因子依然稳健, AI 增强组合上周表现有所分化。 | | | | | | 余浩淼(分析师) | | 本报告导读: | | 021-38676666 | | 上周(特指 20250623-20250627,下同)高频因子上周表现分化,日内收益与尾盘占 比因子强势。深度学习因子依然稳健,AI 增强组合上周表现有所分化。 | 登记编号 | S0880525040013 | 投资要点: 金融工程/[Table_Date] 2025.06.29 金 融 工 程 周 报 证 券 研 究 报 告 请务必阅读正文之后的免责条款部分 金 融 工 程 [Table_Summary] 高频因子上周表现分化,日内收益与尾盘占比因子强势:日内高频 偏度因子上周、6 月、2025 年多空收益为-0.51%,1.48% ...
你的扫描全能王,作价217亿冲刺港股IPO
量子位· 2025-06-27 10:57
杰西卡 发自 凹非寺 量子位 | 公众号 QbitAI 一招鲜,吃遍天。 你在用的名片全能王,现在要冲刺港股"智能文字识别第一股"了! 名片全能王、扫描全能王母公司——上海合合信息科技 (以下简称"合合") ,最近刚在港交所递交招股书。 这不是合合第一次涉足资本市场,2024年9月26日,合合已经在A股科创板上市,发行价55.18元,上市首日收盘价113.62元,市值达113.62 亿。 整整9个月后,合合计划以217亿市值,再度赴港递表,冲刺"A+H"双重上市。 2024年,合合营收14.38亿元,净赚4亿,毛利率高达84.3%。 同年C端产品的月活跃用户数达1.71亿,在全球C端效率类AI"超级APP"公司中,合合排第五。 前四是谁?你再熟悉不过了: OpenAI、谷歌、Adobe和微软 。 不止"全能王",原来你还会这么多? 在招股书中,合合的定位是一家人工智能及大数据科技企业,专注多模态大模型文本智能技术。 其核心业务同时面向 C端 和 B端 ,并分别推出了产品组合。 先看C端,核心产品你可能已经很熟悉, 扫描全能王、名片全能王、启信宝 都出自合合。 前两款产品,属于智能文字识别类型,在不同场景提供文 ...