Rain

Search documents
首创Mid-training范式破解RL奥秘,Llama终于追平Qwen!
机器之心· 2025-06-30 09:49
论文链接:https://arxiv.org/abs/2506.20512 代码仓库:https://github.com/GAIR-NLP/OctoThinker 近期,一份来自上海创智学院、上海交通大学的前沿研究论文吸引了人工智能领域的广泛关注。该论文深入探讨了不同基础语言模型家族(如 Llama 和 Qwen)在 强化学习(RL)训练中迥异表现的背后原因,并提出创新性的中期训练(mid-training)策略,成功地将 Llama 模型改造成高度适配强化学习的推理基础模型,显 著缩小了其与天生擅长 RL 扩展的 Qwen 模型之间的性能差距,为下一代 reasoning 能力 AI 系统的开发提供了关键的科学基础和技术路径。 论文发布后在社交媒体引发广泛关注,Meta AI 研究科学家、即将赴 UMass Amherst 任助理教授的 Wenting Zhao 率先盛赞:"Truly impressed by how an academic lab just figured out a lot of mysteries in mid-training to close the RL gap betwee ...
A股开盘速递 | 三大指数全线上涨!脑机接口、芯片产业链反复走强
智通财经网· 2025-06-30 02:02
脑机接口概念盘中强势,际华集团涨停,翔宇医疗、荣泰健康等涨超5%。 6月30日,A股开盘涨跌不一,随后三大指数拉升上涨,截至9:51,沪指涨0.09%,深成指涨0.35%,创 业板指涨0.48%。 银河证券指出,上周五晚间央行公布了最新的货币执行报告,结合周内发改委会议,后续政策稳步推进 经济缓慢复苏的逻辑依然存在,所以A股中期缓慢上行的趋势没有变化。但短期受中东冲突生变影响, 需要进一步观察资金情绪变化。 盘面上,热点较为杂乱。EDA、脑机接口、光刻机等板块指数涨幅居前。芯片产业链反复走强,光刻 机、存储方向领涨,好上好走出4连板,中瓷电子、凯美特气涨停,波长光电、凯格精机等多股涨超 5%;光伏概念股拉升,欧晶科技涨停,双良节能、爱旭股份、大全能源涨超5%。 展望后市,华安证券研判,5月降准降息后,货币政策尤其是总量政策进入落地观察期、加码概率较 小,预计7月更多通过逆回购以及结构性工具进行流动性投放。但考虑到下半年增长压力加大,不排除 央行继续加码宽松的可能,时间点预计在美联储重启降息前后。 热门板块 1、脑机器接口 点评:中泰证券指出,脑机接口技术突破+临床验证双轮驱动,产业化进程临近关键拐点,产业落地 ...
X @The Wall Street Journal
The Wall Street Journal· 2025-06-30 00:29
Vests used for decades in military-type training are now popular with middle-aged women and other power walkers. What does the research say? https://t.co/NwmXh4oqe2 ...
陆家嘴财经早餐2025年6月30日星期一
Wind万得· 2025-06-29 22:30
3 、 海康威视回应 " 被加拿大政府命令停止运营 " 称,强烈反对加拿大政府以所谓的 " 国家安全担忧 " 为由,作出海康威视加拿大公司在 120 天内关停的 决定。 这种做法罔顾事实,希望加拿大政府尊重法治,实事求是,而非以臆想和偏见为由采取歧视行动。此前,中国驻加拿大使馆发言人亦表示,中方 对此强烈不满和坚决反对。中方敦促加方停止把经贸问题政治化、泛安全化,停止对中国企业的无理打压,为中国企业正常经营提供公平、公正、非歧视 的环境。 1 、 6 月 28 日 -29 日, 2025 上市公司论坛在温州举行。论坛上,沪深北港四大交易所相关负责人集中发声,释放多维度改革信号。上交所副总经理王泊 表示,将扎实推进 "1+6" 改革举措和示范案例落实落地; 深交所副总经理李辉称,正紧锣密鼓地谋划和落实创业板改革;北交所副总经理周箴表示,将 守正创新,赋能中小企业高质量发展;港交所董事总经理徐经纬预计, "A+H" 上市趋势二季度越发明显,目前有超过 30 家 A 股企业已递交 H 股上市申 请,另有超过 20 家 A 股企业已发布关于 H 股上市计划的公告。 2 、海关总署公告称,在持续开展针对日本福岛核污染水 ...
X @Tesla Owners Silicon Valley
Tesla Owners Silicon Valley· 2025-06-29 17:02
Elon Musk "Human brain is a remarkable organ. We are the brain. Basically, you can get a heart transplant, you can get a kidney transplant, but I don't know anyone who's gotten a brain transplant.”https://t.co/HDqRYMShuU ...
X @The Wall Street Journal
The Wall Street Journal· 2025-06-29 00:43
Vests used for decades in military-type training are now popular with middle-aged women and other power walkers. What does the research say? https://t.co/PmOoiklzrp ...
从后训练回到预训练,LLM+RL 的潜力兑现有有机会走更远吗?
机器之心· 2025-06-28 05:22
都是 NPT,用 RL 做预训练的潜力更大吗?为什么强化学习里很少有预训练模型?最流行的 RL 范式有何理论缺陷? 已有成效 的后训练 RL 实现存在什么问题? 2. 硅谷 AI Leaders 近期「暴论」大盘点! 1.从后训练回到预训练,LLM+RL 的潜力兑现有有机会走更远吗? 未来订阅 ChatGPT 就送人形机器人?AGI 为什么可能永远无法实现?为什么 AI 比程序员更显性价比?行业大模型真的没必要 吗?做好研究不如写好推文?OpenAI 和 Nvidia 的「AI 工厂」有何区别? 本期完整版通讯含 2 项专题解读 + 29 项 AI & Robotics 赛道要事速递,其中技术方面 11 项,国内方面 9 项,国外方面 9 项。 本期通讯总计 23143 字,可免费试读至 9% 机器之心PRO · 会员通讯 Week 26 --- 本周为您解读 ② 个值得细品的 AI & Robotics 业内要事 --- ① LLM 预训练对监督数据的需求趋于无穷,且需要覆盖尽可能所有遇到的问题,同时要求监督信号必须准确无 误,从而保证模型正确性。 ② 两项要求在现实中均难以实现,原因在于高质量人类标注数据 ...
Extraordinary Moments from Neuralink's Summer Update 2025
Neura Pod – Neuralink· 2025-06-28 04:16
Neura Pod is a series covering topics related to Neuralink, Inc. Topics such as brain-machine interfaces, brain injuries, and artificial intelligence will be explored. Host Ryan Tanaka synthesizes information, shares the latest updates, and conducts interviews to easily learn about Neuralink and its future. X: https://www.x.com/ryantanaka3/ Support: https://www.patreon.com/neurapod/ Opinions are my own. Neura Pod receives no compensation from Neuralink and has no formal affiliation to the company. Ryan Tana ...
X @TylerD 🧙♂️
TylerD 🧙♂️· 2025-06-28 00:00
I'm sorry, what*Walter Bloomberg (@DeItaone):NEURALINK HAS IMPLANTED ITS "TELEPATHY" BRAIN CHIP IN SEVEN HUMANS AND GAINED APPROVAL TO LAUNCH TRIALS IN CANADA AND UAE ...