大语言模型(LLM)

Search documents
师兄自己发了篇自动驾大模型,申博去TOP2了。。。
自动驾驶之心· 2025-07-09 12:56
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 大模型在自动驾驶功能上的落地逐渐清晰化,理想、华为等公司开始推行自己的VLA、VLM方案。那么下一代大 模型需要关注的点有哪些呢? 按照早期自动驾驶技术发展的规律,当数据和方案基本验证有效后,开始重点关注轻量化与硬件适配、知识蒸馏与 量化加速、高效微调大模型等方向! 除此之外目前大火的CoT方案也是后期完成空间感知的重点,VLA+强化学习等高级推理范式也被行业重点关注。 这些问题是学术界和工业界亟需要解决的,相关的论文研究受到审稿人的青睐,国内外越来越多的团队正在从事相 关方向研究。我们了解到不少同学靠着自己的努力,发了篇和自动驾驶相关的大模型工作,申博去了TOP2!前面 收到很多同学的求助,希望能够辅助开展大模型相关的论文指导研究,解决无人带发论文,缺乏指导的痛点。 自动驾驶之心联合业内知名大模型方向学者,开展了1v6的大模型论文指导小班课,解决无人带、易踩坑、不知如 何写稿、投稿的难题。 ⼀、课程介绍⭐ 随着大语言模型(LLM)和多模态模型的快速发展,如何提升模型效率、扩展知识能力以及增强推理性能已成为 ...
独家洞察 | RAG如何提升人工智能准确性
慧甚FactSet· 2025-06-10 05:12
对于使用生成式人工智能(GenAI)和大语言模型(LLM)的金融服务公司来说,数据准确性无疑是最 关键的要求之一。不准确、低质量或脱节的数据会产生连锁反应,影响公司战略、运营、风险管理和合 规。 本文将探讨AI数据不准确的主要原因,以及检索增强生成(RAG)在缓解这一问题中的作用。 数据不准确的主要原因 数据录入和验证错误: 随着时间推移,手动录入财务数据和质量检查不足可能导致转录错误、录入 数据不完整、格式错误或数据丢失。 信息过时: 如无定期管理,数据就可能随时间推移而劣化,导致分析结果不准确和误导决策。 集成问题: 公司内部各类旧系统与新技术往往衔接不畅,造成信息不匹配或丢失。 数据标准不一致: 不同部门可能采用不同的数据治理标准或格式,导致难以整合或比较信息。 在 提 高 生 成 式 人 工 智 能 准 确 性 、 显 著 减 少 幻 觉 的 策 略 中 , 最 重 要 的 技 术 之 一 就 是 检 索 增 强 生 成 (RAG),它可供开发者在大语言模型上搭建软件产品时使用。RAG就像给大语言模型的提示语中加 了"上下文",从而把生成的回答与真实数据相结合。 通过RAG增强大语言模型的回答可带来诸 ...
提前探营!今年上交会暗藏哪些“科技密码”?
Guo Ji Jin Rong Bao· 2025-05-28 08:29
6月11日至13日,第十一届中国(上海)国际技术进出口交易会(下称"上交会")将在上海世博展览馆举办。 "2025年将是该中心在上交会的首秀。"港科大上海中心副主任钱文馨告诉记者,中心将携创新研发的自有教育品牌体系"AHEAD"及多家已入驻的科创 企业一同参展,并带来港科大6个最新研究成果和技术转移优质项目,包括大语言模型(LLM)的人工智能网络安全防护、垃圾渗滤液电化学循环氧化高效 处理技术、人工智能驱动的智能牙科治疗自动化设计系统等。这些项目紧密围绕人工智能、机器人技术和可持续发展方向,旨在向长三角地区积极推进技术 转移以及产学研合作。 其中,将在本届上交会上展示的TI(Temporal Interference)神经调控疗法是一种非侵入性脑深部电刺激技术。它利用大脑仅对低频信号响应而对高频信 号不响应的生理原理,以及高频信号强穿透性和精确方向性的物理原理,通过在头皮表面放置电极,生成多个高频电场在大脑中相互干涉,仅在它们的交叉 区域产生有效的低频调制,通过精确控制电场的频率、相位和强度,实现对大脑特定区域的非侵入性刺激,有效调节神经活动。该应用对帕金森、失眠、抑 郁症、焦虑等有明显的治疗或缓解效果。 作 ...
百亿私募大动作 成立AI公司!
Zhong Guo Ji Jin Bao· 2025-05-26 14:50
记者从业内获悉,近期,沪上百亿量化私募念空科技成立了上海全频思维人工智能科技有限公司(中文简称全频思维,英文简称AllMind),探索AI的前 沿课题。该公司还和上海交通大学计算机学院合作撰写论文《面向特定任务大型语言模型的监督微调与强化学习分步式自适应集成》,于今年5月投向 NIPS(神经信息处理系统大会)。 今年截至目前,九坤、宽德、鸣石、黑翼等多家百亿私募积极布局AI。业内人士认为,DeepSeek火爆,量化行业备受鼓舞。机构依靠自身人才和技术方 面的优势,积极探索AI领域。此举不仅能提升自身竞争力,而且可以拓展业务边界,为科技创新出力。 百亿量化私募,纷纷加入人工智能(AI)"军备竞赛"。 成立人工智能科技公司 与高校合作撰写涉及大模型论文 5月19日,念空科技成立了全频思维(AllMind),为一家专注于研究通用大语言模型(LLM)相关底层算法和工程技术的创新型科技公司。 | 工商信息 ● ◎ 查看工商快照 | | | | | 园 数据纠错 미 루버 | 2天眼查 | | --- | --- | --- | --- | --- | --- | --- | | 企业名称 | 上海全频思维人工智能科技有 ...
微软副总裁X上「开课」,连更关于RL的一切,LLM从业者必读
机器之心· 2025-05-26 01:28
选自 作者:Nando de Freitas 机器之心编译 别人都在用 X 发帖子,分享新鲜事物,微软副总裁 Nando de Freitas 却有自己的想法:他要在 X 上「开课」,发布一些关于人工智能教育的帖子。该系列会从 LLM 的强化学习开始,然后逐步讲解扩散、流匹配,以及看看这些技术接下来会如何发展。 话说回来,Freitas 有这个想法时还是 4 月 24 日,到今天为止,他已经更新了多篇帖子,每篇都干货满满。 由于涉及的内容需要费点脑细胞来思考,在更新了几篇后,Freitas 抱怨道:「随着数学知识的增多,自己 X 上的读者人数正在下降。」 | (5 17 16 ♡ 112 | | --- | | III 16K | | 3 | 或许,太硬核的东西,浏览量确实不会太高。 不过,遗憾归遗憾,这些帖子对于那些想学习 RL、从事大模型的人非常有帮助。 Freitas 也表示,他会不断更新内容,感兴趣的读者可以随时关注。 接下来,我们看看最近几篇帖子内容。 无监督学习、监督学习、强化学习终极定论尚未形成 监督学习 对应于最基础的模仿形式:简单的行为复制。它通过最大似然估计,将世界状态(如文本问题)映射到 ...
中国人工智能强势逆袭
财富FORTUNE· 2025-05-13 13:09
插图来源:CHARIS TSEVIS, PHOTOS COURTESY OF THE COMPANIES 美国引领创新,中国擅长迭代。这个说法(或者更加直白的版本:"中国擅长模仿")长期主导着关于世界第一大经济体和第二大经济体的相对实力 的诸多讨论。传统观点认为,美国始终矗立在技术前沿,用颠覆性的产品和服务引领全球经济;而中国往往会借鉴这些创意,迅速推出更廉价、或 许质量稍逊的产品版本。 在人工智能领域里,这一陈见多年来似乎都有据可依。面对财力雄厚、人才济济的美国科技巨头,中国企业始终疲于追赶。但在今年1月,一家中国新创 企业打破了这种说法。 总部位于中国浙江省杭州市的深度求索 (DeepSeek)——严格来说甚至算不上是一家科技公司,而是对冲基金幻方量化的衍生团队——发布了"推理 型"大语言模型(LLM)R1。其性能竟与美国的人工智能翘楚OpenAI公司在几个月之前发布的大语言模型o1旗鼓相当。R1感觉像是从天而降,不仅 创新性十足,成本也低得令人震惊。据DeepSeek透露,其前代模型V3最终的训练成本仅为600万美元。特斯拉(Tesla)的前人工智能科学家安德烈· 卡尔帕西(Andrej Karpath ...
特朗普,突传大消息!
券商中国· 2025-05-13 08:23
美国总统特朗普将于5月13日至16日访问沙特阿拉伯、卡塔尔和阿联酋三国。据澎湃新闻援引外媒报 道,有消息人士透露,美国政府正在考虑一项协议,拟向阿联酋人工智能公司G42提供数十万枚美国设 计的人工智能芯片。 白宫人工智能和加密货币事务负责人戴维·萨克斯正在与G42公司及阿联酋官员进行谈判,推动一项允许该公司 在有限监管下获取美国芯片的协议,其中部分芯片将用于G42与美国公司OpenAI的合作项目,其余的则直接提 供给G42。另有两名知情人士透露,特朗普政府预计本周还将宣布与沙特阿拉伯达成协议,允许沙特政府及其 新成立的人工智能公司Humain获取数万枚半导体芯片,并获得英伟达及其竞争对手超威半导体(AMD)的技 术支持。 此外,特朗普当地时间12日表示,他愿意参加将在土耳其举行的俄乌会谈。此前,俄罗斯总统普京提议于5月 15日在土耳其伊斯坦布尔恢复俄乌直接谈判。 5月12日,乌克兰总统泽连斯基说,乌克兰愿意与俄罗斯总统普京进行直接和实质性的会谈,并已准备好前往 土耳其。泽连斯基还特别提到,美国总统特朗普全力支持此次会晤,并希望特朗普能找机会来土耳其。 俄乌拟在土耳其会谈,特朗普:我可能飞过去 据中国新闻网援引 ...
晚点独家丨字节 AI 研发调整继续:吴永辉直接管理范围扩大,AI Lab 3 个方向并入 Seed
晚点LatePost· 2025-04-22 15:58
这些陆续的调整,共同指向字节跳动正进一步整合 AI 研发力量。 文 丨 王与桐 编辑 丨 程曼祺 继吴永辉担任字节 AI 研发部门 Seed 的负责人后,Seed 组织正在陆续调整。 吴永辉直接管理范围扩大。据了解,近期原 Seed 大语言模型(LLM)负责人乔木已多日未现 身办公室,他的工作飞书也处于停用状态。LLM 之下的 3 个团队,Pre-train(预训练)、Post- train(后训练) 和 Horizon 转为直接向吴永辉汇报。 约半月前的另一个变化是,字节 AI Lab 的 3 个方向正式并入 Seed,分别是探索机器人和具身 智能的 Seed Robotics,将 AI 应用于材料、生物等科研探索的 AI for Science 和致力于让 AI 公正、透明、可解释且符合伦理标准的 Reponsible AI。 字节跳动进一步整合 AI 研发力量。 自 2023 年下半年以来,AI Lab 的 NLP(自然语言处理)和 Pixel Dance(视频生成团队)已陆续并 入 Seed。最新调整意味着,AI Lab 正式在组织结构上被 Seed 全部吸收到。李航仍为 AI Lab 负责 人,此次 ...
欧米伽未来研究所:100部前沿科技未来发展趋势报告综述(2025年3月)
欧米伽未来研究所2025· 2025-04-06 05:22
" 欧米伽未来研究所 " 关注科技未来发展趋势,研究人类向欧米伽点演化过程中面临的重大机遇与挑战。将 不定期推荐和发布世界范围重要科技研究进展和未来趋势研究。( 点击这里查看欧米伽理论 ) 2025年3月,全球科技界迎来一股强劲的创新浪潮,其核心驱动力非人工智能(AI)莫属。本文 通过对当月密集发布的科技报告进行解读,揭示了AI正以前所未有的深度和广度渗透并赋能各个 领域。从大语言模型的持续演进和AI智能体的崭露头角,到能源革命、机器人浪潮、量子计算等 前沿技术的突破,以及数字化生存带来的新思考,都清晰地描绘出一幅以AI为核心,多领域技术 深度融合的宏伟蓝图。然而,在拥抱科技进步的同时,安全、伦理与治理等挑战也日益凸显,需 要全球共同关注和应对。 欧米伽未来研究所 2025 年 3 月收录了近 300 篇世界范围人类与科技未来趋势研究报告,并从 中精选出 118 部。这些报告全面反映了全球在前沿科技领域的最新动向和特点,对各行业专业 人士感知科技未来脉搏具有重要的指导和参考意义。 人工智能:从 "无所不在" 到 "无所不能" 的飞跃 人工智能的发展已然进入了一个全新的阶段。过去,我们见证了 AI 概念的普及以 ...
GenAI 内存解决方案第 5 部分:DeepSeek 在芯片领域的高光时刻
Counterpoint Research· 2025-02-19 09:46
DeepSeek 的大语言模型(LLM)因其在性能上接近 ChatGPT ,但成本却大幅降低而受到关注。市 场的即时反应褒贬不一。虽然数据训练成本,比如数据标注和归类等方面的成本可能没有体现出 来,而这部分成本由政府支持,但 DeepSeek 在训练效率和低成本方面的优势依然十分明显。 DeepSeek 能否助力中国芯片制造? 中国的存储芯片或已具备成本竞争力 : 假设中国政府对构成总成本很大一部分的固定成本提供支持 ,那么与同行相比,中国已能实现有竞争力的成本。例如,2024 年第一季度 DRAM (动态随机存 取存储器)每 Gb ( 千兆字节 )的价格为 $0.34 ,此时高价的 HBM (高带宽存储器)对平均售价 的影响较小。而韩国 DRAM 的总成本大约为售价的 67% ,约为 $0.23 ,在不计固定成本的情况 下,中国的成本可能低至 $0.20 。(不过,中国的固定成本远高于韩国。) 高效的软件为低端硬件打开市场: 中国的策略是通过规模优势弥补与竞争对手在性能上的差距。华 为最新的 GPU —— Ascend 920 支持 HBM2 和 HBM2e ,而这些对于行业同行来说已是两年前的标 准,并未 ...