Workflow
模型优化
icon
Search documents
师兄自己发了篇自动驾大模型,申博去TOP2了。。。
自动驾驶之心· 2025-07-09 12:56
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 大模型在自动驾驶功能上的落地逐渐清晰化,理想、华为等公司开始推行自己的VLA、VLM方案。那么下一代大 模型需要关注的点有哪些呢? 按照早期自动驾驶技术发展的规律,当数据和方案基本验证有效后,开始重点关注轻量化与硬件适配、知识蒸馏与 量化加速、高效微调大模型等方向! 除此之外目前大火的CoT方案也是后期完成空间感知的重点,VLA+强化学习等高级推理范式也被行业重点关注。 这些问题是学术界和工业界亟需要解决的,相关的论文研究受到审稿人的青睐,国内外越来越多的团队正在从事相 关方向研究。我们了解到不少同学靠着自己的努力,发了篇和自动驾驶相关的大模型工作,申博去了TOP2!前面 收到很多同学的求助,希望能够辅助开展大模型相关的论文指导研究,解决无人带发论文,缺乏指导的痛点。 自动驾驶之心联合业内知名大模型方向学者,开展了1v6的大模型论文指导小班课,解决无人带、易踩坑、不知如 何写稿、投稿的难题。 ⼀、课程介绍⭐ 随着大语言模型(LLM)和多模态模型的快速发展,如何提升模型效率、扩展知识能力以及增强推理性能已成为 ...
大模型在自动驾驶后期的落地与研究方向有哪些?
自动驾驶之心· 2025-07-07 23:31
大模型在自动驾驶功能上的落地逐渐清晰化,理想、华为等公司开始推行自己的VLA、VLM 方案。那么下一代大模型需要关注的点有哪些呢? 按照早期自动驾驶技术发展的规律,当数据和方案基本验证有效后,开始重点关注轻量化与硬 件适配、知识蒸馏与量化加速、高效微调大模型等方向! 除此之外目前大火的CoT方案也是后期完成空间感知的重点,VLA+强化学习等高级推理范式 也被行业重点关注。 这些问题是学术界和工业界亟需要解决的,相关的论文研究受到审稿人的青睐,国内外越来越 多的团队正在从事相关方向研究。前面收到很多同学的求助,希望能够辅助开展大模型相关的 论文指导研究,解决无人带发论文,缺乏指导的痛点。 自动驾驶之心联合业内知名大模型方向学者,开展了1v6的大模型论文指导小班课,解决无人 带、易踩坑、不知如何写稿、投稿的难题。 ⼀、课程介绍⭐ 解决只了解大模型相关零散知识,没有清晰的体系的问题,帮助系统掌握指定方向的重点理论知 识,同时做适当拓展,让学员对指定方向内容形成更清晰的体系; 解决没有方向,动手能力差,无法复现论文,帮助同学将模型理论与代码实践相结合,协助同学 开发设计新模型铺垫基础;能让学员将baseline深化拓 ...
大模型这个坑,还有哪些可以发论文的点?
具身智能之心· 2025-07-05 02:25
随着大语言模型(LLM)和多模态模型的快速发展,如何提升模型效率、扩展知识能力以及增强推理性能已成 为当前人工智能研究的核心议题。我们联合业界知名大模型专家,为大家退出了大模型1v6论文辅导小班课! ⼀、有关大模型核心的几个点⭐ 本课程系统性地探讨大模型的前沿优化方法,重点研究参数高效计算、知识动态扩展和复杂推理三大方向的关键 技术。我们将深入分析大模型优化中的核心挑战:在参数压缩方面,研究剪枝稀疏化和量化加速等轻量化方法; 在知识扩展方面,探索检索增强生成(RAG)和参数高效微调(PEFT)等动态知识注入技术;在推理优化方 面,研究链式思维(CoT)和强化学习优化(GRPO)等高级推理范式。同时,课程还将探讨多智能体协作和多 模态理解等前沿方向。 通过本课程的学习,你将掌握大模型优化的核心算法,包括但不限于:结构化剪枝、低比特量化、动态检索、角 色化智能体、多跳推理等关键技术。课程采用理论讲解与实验实践相结合的方式,使用主流大模型(如 LLaMA、GPT等)作为实验平台,重点培养学生在模型优化和推理增强方面的研究能力。 关键词:大模型优化;参数高效计算;检索增强生成;链式推理;多智能体协作;多模态理解 ⼆、 ...
下一代大模型高效计算:参数压缩、硬件适配与多模态推理、CoT等方向论文指导班来啦!
自动驾驶之心· 2025-07-04 07:13
⼀、课题简介⭐ 随着大语言模型(LLM)和多模态模型的快速发展,如何提升模型效率、扩展知识能力以及增强推理性能已成 为当前人工智能研究的核心议题。本课程系统性地探讨大模型的前沿优化方法,重点研究参数高效计算、知识动 态扩展和复杂推理三大方向的关键技术。 课程将深入分析大模型优化中的核心挑战:在参数压缩方面,研究剪枝稀疏化和量化加速等轻量化方法;在知识 扩展方面,探索检索增强生成(RAG)和参数高效微调(PEFT)等动态知识注入技术;在推理优化方面,研究 链式思维(CoT)和强化学习优化(GRPO)等高级推理范式。同时,课程还将探讨多智能体协作和多模态理解 等前沿方向。 通过本课程的学习,你将掌握大模型优化的核心算法,包括但不限于:结构化剪枝、低比特量化、动态检索、角 色化智能体、多跳推理等关键技术。课程采用理论讲解与实验实践相结合的方式,使用主流大模型(如 LLaMA、GPT等)作为实验平台,重点培养学生在模型优化和推理增强方面的研究能力。 关键词:大模型优化;参数高效计算;检索增强生成;链式推理;多智能体协作;多模态理解 ⼆、课程目的 三、招生人数⭐ 6⼈/期(⾄多8人) 四、招生对象⭐ 五、课程收获 解决 ...
韩松贾扬清之后,又一家清华系AI公司卖给英伟达,黄仁勋亲自招募95后联创
量子位· 2025-06-29 07:43
梦晨 发自 凹非寺 量子位 | 公众号 QbitAI 与此同时,Nexusflow的CTO Jian Zhang (同样是清华校友)也成为英伟达应用研究总监。 但Nexusflow这家公司到底何去何从还没有正式消息。 贾扬清LeptonAI之后,又一家华人AI创业公司卖身英伟达。 黄仁勋亲自出马招募了Nexusflow的几位联合创始人: △ 左:焦剑涛,右:朱邦华 后续Nexusflow的早期投资者证实,公司已被英伟达收购。 Nexusflow如何搭上英伟达这条线或许有迹可循。 另一位联创UC伯克利教授 Kurt Keutzer 在2025年参与了英伟达与学术界合作的项目 Efficient AI ,致力于开发和优化GPU加速的高效AI 计算。 焦剑涛 ,前Nexusflow CEO,UC伯克利副教授,斯坦福博士毕业,清华2011年本科特奖得主。加入英伟达任研究总监及杰出科学家 (Distinguished Scientist) 朱邦华 ,前Nexusflow联创,将加入华盛顿大学任助理教授,UC伯克利毕业,本科也来自清华。加入英伟达任Principal Research Scientist Kurt Keu ...
上海浦东发展银行股份有限公司2024年年度股东会决议公告
证券代码:600000 证券简称:浦发银行 公告编号:临2025-032 2024年年度股东会决议公告 本公司董事会及全体董事保证本公告内容不存在任何虚假记载、误导性陈述或者重大遗漏,并对其内容 的真实性、准确性和完整性承担法律责任。 重要内容提示: ● 本次会议是否有否决议案:无 一、会议召开和出席情况 (一)股东会召开的时间:2025年6月27日 (二)股东会召开的地点:上海市莲花路1688号 优先股代码:360003 360008 优先股简称:浦发优1 浦发优2 转债代码:110059 转债简称:浦发转债 上海浦东发展银行股份有限公司 (三)出席会议的普通股股东和恢复表决权的优先股股东及其持有股份情况: ■ 注:出席会议的股东包括出席现场会议的股东及通过网络投票出席会议的股东。 (四)表决方式是否符合《公司法》及《公司章程》的规定,会议主持情况等。 本次会议采用现场与网络投票相结合的方式,对需审议议案进行逐项投票表决,表决方式符合《公司 法》《公司章程》及相关法律、法规的规定。本次会议由公司董事长张为忠先生主持。 (五)公司董事、监事和董事会秘书的出席情况 1、公司在任董事11人,出席11人; 2、公司 ...
无需SFT也不用RL,样本级推理优化神器SLOT来了,准确率轻松+10%
机器之心· 2025-06-09 08:03
近期,当很多人还在纠结用什么 label 和 reward 训练大模型的时候,以及纠结用什么样的基准模型进行公平比较的时候,西湖大学 MAPLE 实验室另辟蹊径:既然 LLM 在复杂指令上表现不佳,需要引入单独的 SFT 或者 RL 过程,那为什么不让模型在推理时「临时学习」一下这 个具体的问题呢?这个看似「离谱」的想法,竟然带来了惊人的效果提升。 试想一下,如果你参加考试时,可以在答题前花几秒钟「适应」一下这道具体的题目,你的表现会不会更好? 这正是西湖大学研究团队在最新论文中提出的核心思想。他们开发的 SLOT(Sample-specific Language Model Optimization at Test-time)方法, 把每个输入 prompt 本身当作一份「迷你训练数据」 ,让模型在生成答案前先「学习」理解这个具体问题。 更令人惊讶的是,这个方法 简单到离谱 : Qwen2.5-7B 在 GSM8K 数学推理任务上准确率从 57.54% 飙升至 66.19% ,提升 8.65 个百分点。 DeepSeek-R1-Distill-Llama-70B 在 GPQA Diamond 上达到 68. ...
胜利油田:以AI赋能应急管理
Zhong Guo Hua Gong Bao· 2025-05-28 02:51
近日,在胜利油田孤东采油厂KD34采油平台控制室内,闪烁的屏幕上突然弹出压力异常预警。值班员 王师傅立即调出实时数据曲线,发现某段输油管道压力值正以每分钟0.3兆帕的速度攀升。随着"启动三 级响应预案"的指令下达,智能系统同步推送处置要点:关闭上游阀门、启动备用泵组、疏散周边人 员。20分钟后,压力值回归正常区间。 值得一提的是,胜利油田针对数据样本不足的情况,也进行了积极探索和尝试。例如在泄漏应急处置 中,技术人员开发参数迁移技术,将海上平台模型适配陆地油库时,仅需补充10%新数据即可完成调 整,训练成本降低70%。而在极端事故模拟中,胜利油田运用生成对抗网络(GAN)技术,将5年间的7 起重大井喷事故数据扩展至85组合成样本。改造后的模型在模拟测试中,对井喷前兆的识别率从32%提 升至78%。 "虽然合成数据不能完全替代真实案例,但显著改善了模型对罕见工况的响应能力。"技术负责人王文通 说。 人员转型:跨越数字技能鸿沟 数据显示,胜利油田通过部署新型传感器,数据采集完整率从68%提升至91%,深海设备年维护成本降 低40%。当前,该油田正通过优化数据治理、改进算法模型、重构协同机制等路径,推动应急管理从经 ...
全国门店超1.4万家,年轻人即将再“吃”出一家IPO?
Sou Hu Cai Jing· 2025-05-02 15:00
从县城崛起的量贩零食连锁,终于正式冲击资本市场。 2025年4月28日,湖南鸣鸣很忙商业连锁股份有限公司(以下简称"鸣鸣很忙"或"公司")正式向港交所递交主板上市申请,高盛、华泰国际为联席保荐人。 这个成立不到十年的量贩零食品牌,凭借"高性价比+下沉市场"的打法,以惊人的速度在全国跑马圈地。截至2024年底,全国门店数量突破1.4万家,年营收 近50亿元,俨然已成为一股不容忽视的新消费力量。 01 鸣鸣很忙的崛起 "下沉市场+加盟快跑"的中国式进击 鸣鸣很忙诞生于2017年长沙。起步阶段,公司选择避开一二线城市的激烈竞争,精准聚焦于三四线及以下城市的下沉市场,通过"便宜好吃、选择多"的策略 打开市场缺口。在零食集合店尚属新鲜事物的当时,"鸣鸣很忙"以迅雷不及掩耳之势迅速复制门店,赢得消费者青睐。 其背后的底层逻辑,是一种"中国式进化":依托加盟模式实现极速扩张,通过标准化选址与装修降低门槛,同时强化供应链压缩成本,形成高周转、高坪效 的商业闭环。 据其招股书披露,截至2024年底,公司门店已达14,180家,覆盖全国31个省级行政区。其中加盟店占比高达97.4%,可谓标准的"轻资产、高复制"典范。这 一模式的 ...