反思

Search documents
盐城市亭湖区:探索实施案件反思剖析圆桌会机制
Zhong Yang Ji Wei Guo Jia Jian Wei Wang Zhan· 2025-07-11 08:56
"张某某的工作业绩体现了组织对他的关心关爱,但这不能成为他实施违法行为的借口……"近日,江苏 省盐城市亭湖区组织庭审旁听,公诉人当庭说法,让在场党员干部沉浸式感受违法行为付出的惨痛代 价。 亭湖区纪委监委将风腐一体典型案件作为警示教育"活教材",综合运用召开警示教育会、拍摄警示教育 片、旁听案件庭审、参观警示教育阵地等方式,深化以案说德、以案说纪、以案说法、以案说责,引导 党员干部筑牢拒腐防变思想堤坝。 "针对查办的严重违纪违法典型案例,我们探索实施案件反思剖析圆桌会工作机制。"该区纪委监委有关 负责同志介绍,此项工作机制主要由案管室、案件主办室、办公室、党风政风监督室、审理室和宣教室 共同参与,对案件查办全过程进行复盘交流的同时,同步商定"以案促改""以案促教"的实施方向,一体 推进建章立制和警示教育,做实案件查办"后半篇文章"。近3年来,先后召开反思剖析会9场,制发纪检 监察建议书14份,累计推动建立"小特精"制度105项,开展警示教育活动32场次。 该区纪委监委梳理了近年来查处的违纪违法案例,以个案深度剖析与类案共性分析相结合的方式,筛选 由风及腐典型案例,拍摄制作警示教育片《"小节"失守终酿大祸》,组 ...
如何教AI学会反思?
Hu Xiu· 2025-07-09 07:57
今天想跟大家分享一篇有意思的AI论文,标题有点长,叫《反思,重试,奖励:通过强化学习实现自我改进的大语言模型》。 说内容前,我先说说自己是怎么发现这篇论文的。熟悉AI的同学大多知道一个网站叫Hugging Face,这个平台不仅有各种大模型的训练场和技术讨论区, 还开设了一个"每日论文"栏目。由于AI领域如今太过火热,每天都有大量新论文发布,这个栏目就像是一个论文版的"知乎热榜"——作者提交论文,读者 点赞排名。 今天要介绍的这篇论文,是这个栏目6月排行榜的第三位。论文作者并不是一个典型的高校研究学者,而是一家名叫Writer的人工智能创业公司的研究团 队,联合作者一共有八个人。 也许正因为是创业企业的研究团队,所以没有那么在乎学术层面的论文惯例,整个论文加上引用也只有16页,读起来也没有故作高深,非常简单明了。 3个步骤,教会AI从错误中学习 这篇论文——《反思、重试、奖励:通过强化学习实现自我改进的大语言模型》——光是题目,你就能知道这项研究的核心结论是什么。 对我们人类来说,"从错误中学习"是非常重要并且有效的学习方式之一。不信你去网上搜搜看,文具有一个专门的品类就叫"错题本"。我们在求学时,当 一道题 ...
日本应吸取侵略战争教训(国际论坛·以史为鉴 共护和平)
Ren Min Ri Bao· 2025-07-06 22:52
作为一名日本近代史研究者,我撰写了多部与中国人民抗日战争有关的著作,其中《何谓中日战争?》 《近代日本政军关系研究——日本发动侵华战争的历史渊源》等已在中国翻译出版。我的研究引用了许 多中文文献资料和文章。根据可靠的文件和资料调查历史事件,是进一步还原侵略战争真相的必要工 作。中国的研究者在努力研究战争问题,而一些日本民众却对这些事件兴趣不大,这也是日本政府和日 本人民对侵略战争缺乏了解的原因。 日本在侵华战争中耗费了大量兵力和军费,这是日本战败的决定性原因。今年是具有特殊历史意义的年 份,希望看到日本政府在吸取侵略战争教训、促进日中友好方面展现担当 今年是中国人民抗日战争暨世界反法西斯战争胜利80周年,日本应借此机会认真反思历史。日本在侵华 战争中耗费了大量兵力和军费,这是日本战败的决定性原因。我对中国人民的勇气和功绩表达敬意。 1995年8月15日,时任日本首相村山富市发表"村山谈话",在日本国内和国际社会都得到了高度评 价。"村山谈话"主张铭记日本的战争责任,倡导独立自主的外交政策,郑重主张日本宪法中规定的和平 理念。然而,一段时间以来,日本政府并没有以"村山谈话"为基础施政。今年是具有特殊历史意义的年 ...
AI操作有了“紧急刹车”!通义&自动化所AI决策诊断模型,GUI智能体纠错正确率SOTA
量子位· 2025-06-17 07:41
阿里通义实验室联合中科院自动化所推出全新的 GUI-Critic-R1 模型,能在操作执行前对GUI智能体的决策进行诊断,以避免不必要的操作 和不可挽回的错误。 GUI-Critic-R1成功纠错的3个案例如下: GUI-Critic-R1团队 投稿 量子位 | 公众号 QbitAI GUI智能体总是出错, 甚至是不可逆的错误。 即使是像GPT-4o这样的顶级多模态大模型,也会因为缺乏常识而在执行GUI任务时犯错。在它即将执行错误决策时,需要有人提醒它出错 了。 指令1:在Joplin应用程序中,有多少与会者参加了名为"员工绩效评估"的会议? 智能体被要求在Joplin应用程序中查找一个文件,但遇到的界面中目标文件不可见,智能体错误地认为应该返回上一个界面。模型建议点击搜 索框以找到目标文件,帮助智能体成功地完成了任务。 指令2:删除"专业费用"中所有完全重复的费用项,只保留每项费用的一个实例。 第5步时,智能体错误地决定点击"统计"按钮,这是不正确的。GUI-Critic-R1模型成功地识别了这个错误动作,分析了错误的原因,即选择此 按钮会导航到显示费用统计的新界面,这与删除重复费用的要求无关。GUI-Cr ...
端到端GUI智能体首次实现“犯错-反思-修正”闭环,模拟人类认知全过程
量子位· 2025-06-11 08:07
端到端多模态GUI智能体有了"自我反思"能力!南洋理工大学MMLab团队提出框架GUI-Reflection。 随着多模态大模型的发展, 端到端GUI智能体 在手机、电脑等设备上的自动化任务中展示出巨大潜力。它们能够看懂设备屏幕,模拟人类去 点击按钮、输入文本,从而完成复杂的任务。 然而,当前端到端GUI多智能体的训练范式仍存在明显的瓶颈:当前模型往往使用几乎完美的离线演示轨迹进行训练,使得模型缺乏反思和改 正自身错误的能力,并进一步限制了通过在线强化学习激发和提升能力的可能。 GUI-Reflection 的核心思想是在智能体的各个训练阶段引入 "反思与纠错"机制 ,这一机制贯穿 预训练、监督微调和在线训练 全过程,模 拟了人类 "犯错→反思→重试" 的认知过程。 1. GUI预训练阶段: GUI-Reflection 团队 投稿 量子位 | 公众号 QbitAI 提出GUI-Reflection Task Suite任务套件, 将反思纠错能力进一步分解,让模型在预训练阶段框架让模型初步接触反思类任务,为后续打 下基础。 2. 离线监督微调阶段: 构建自动化数据管道,从已有离线无错轨迹中构建带有反思和纠错的 ...
侵华日军细菌战添新证:《抗战时期细菌战与防疫战文献集》出版
Xin Hua She· 2025-06-10 08:23
中方史料涵盖了台湾岛内机构所藏国民政府防疫档案,生动呈现中国军民应对细菌战的历史细节。俄文史料包括对伯力审判档案、俄安全局新解 密档案等,揭示侵华日军细菌战对苏联的战略威胁,以及战后美苏对日军罪行隐匿与揭露的博弈。此外还收录了英国、澳大利亚等国家档案馆藏 有关日本战争罪行的档案。 该书主编、南京大学历史学院副教授吕晶说:"日本军医报告与细菌部队官兵证言同国民政府防疫档案、战犯审判口供等多国史料交叉印证,形 成'加害—受害—第三方见证'的完整证据链条。"武汉大学教授王萌说,该成果对日本右翼势力否认细菌战的言论构成直接反驳,为构建中国抗战 史学自主话语体系提供扎实基础。 据悉,该书依托国家社科基金抗日战争研究专项工程、国家出版基金、"十四五"国家重点出版物出版专项规划和国家记忆与国际和平研究院智库 专项等支持,汇聚中、日、新加坡等国家和地区23位学者,50余名高校学生参与档案整理,总字数约 360万字。课题组及首席专家、南京大学教 授张宪文表示,这一研究体现了中国学界在战争罪行实证研究领域的积极探索,其跨档案、跨国界的史料整理模式,可为全球范围内战争记忆与 历史正义研究提供范式参考。 记者6月10日从南京大学中华 ...
首个多模态专用慢思考框架!超GPT-o1近7个百分点,强化学习教会VLM「三思而后行」
量子位· 2025-06-06 13:45
VL-Rethinker团队 投稿 量子位 | 公众号 QbitAI 1.1 GRPO中的「优势消失」问题 (Vanishing Advantages) 在GRPO算法中,优势信号(advantage)是通过比较同一查询组内不同候选回复的奖励来计算的 。当同一个问题组内所有回答获得相同奖 励(例如,全部正确或全部错误)时,计算得到的优势信号便为零 。研究团队发现,在GRPO训练多模态模型的过程中,随着训练的推进, 出现零优势信号的样本比例显著增加,这种现象被定义为 「优势消失」 (Vanishing Advantages) 。 相比于用于更多高质量推理数据的纯文本推理,Vanishing Advantages在能力较强的多模态模型强化学习时尤其突出。 这种显著的Vanishing Advantages源于两方面原因: 在文本推理领域,以GPT-o1、DeepSeek-R1为代表的 "慢思考" 模型凭借显式反思机制,在数学和科学任务上展现出远超 "快思考" 模型 (如 GPT-4o)的优势。 然而,当战场转移至多模态推理场景时,这些「思维巨匠」却表现平平:GPT-o在MathVista、MathVerse等多模 ...
生死战告负,国足无缘美加墨世界杯
Zhong Guo Xin Wen Wang· 2025-06-06 01:10
原标题:生死战告负,国足无缘美加墨世界杯 当地时间5日晚,印尼雅加达格罗拉蓬卡诺体育场涌入近八万球迷,中国男足未能攻破印尼队魔鬼 主场,以0:1告负的同时,提前一轮无缘2026美加墨世界杯。 于国足而言,这是一场不容有失的生死战。前8轮过后,国足仅积6分小组垫底,印尼队领先中国队 3分且多7个净胜球。若能在主场击败国足,印尼队将基本锁定小组前四;而国足此役打平或者告负,都 将无缘美加墨世界杯,最后一场在重庆主场与巴林队的对决也将失去实际意义。 冲击世界杯的征程再一次以失败告终,国足的失利不只是赛场上的细节。当印尼队通过归化和青训 双轨并进从而脱胎换骨时,中国足球能够从这个亚洲对手身上反思和复盘的细节就有很多。 最后一场国足与巴林队的对决将变为荣誉之战。18强赛落幕后,中国足球希望又在何处?赛后被问 及这个问题时,伊万科维奇说,没能率队晋级世界杯,教练有很大责任,但年轻球员为球队注入了动 力,从他们的比赛内容中能看到很好的未来。 尽管印尼队世界排名远低于中国队,历史交手纪录上国足也明显占优,但出现在18强赛上的印尼队 已今非昔比。近年来通过归化多名欧洲球员,印尼队已显见欧洲足球风格,他们主场2:0战胜沙特队, ...
人生七大底层逻辑,不要搞反了
洞见· 2025-06-05 10:28
洞见 ( DJ00123987 ) —— 不一样的观点,不一样的故事, 3000 万人订阅的微信大号。点击标题下 蓝字 " 洞见 " 关注,我们将为您提供有价值、有意思的延伸阅读。 见微以知萌,见端以知末。 ♬ 点上方播放按钮可收听洞见主播亚楠朗读音频 芒格曾说:"每件事表象之下必有其深层次的结构和逻辑。就如同深掘土壤,才能找到那滋养 万物的根脉。" 有人做事能够事半功倍,有人却事倍功半。 就是因为前者能够在更短的时间内看清事物的底层逻辑,而后者则不假思索,直接开始蛮干。 错位的做事逻辑,会像一道道阻碍,让你在追逐目标的道路上渐行渐远。 正确的顺序,才是成事的关键,以下七大人生底层逻辑千万别搞反了。 01 作者: 洞见moon 1853年,美国掀起一股淘金热。 旧金山几乎所有企业都停止了营业,海员抛弃了船只,工人扔下工具……甚至连传教士也离开 了布道所,涌向金矿发源地。 二是 淘金工作非常辛苦,人们的衣服经常被磨破,苦不堪言。 于是他果断放弃淘金,转而收购了一批结实的丹宁布和帆布,制成专门的淘金工作服,赚了一 大笔钱。 这位年轻人就是李维·斯特劳斯,他靠着淘金热发家,打造出李维斯牛仔裤商业帝国。 作家蔡磊垒说 ...
看似无害的提问,也能偷走RAG系统的记忆——IKEA:隐蔽高效的数据提取攻击新范式
机器之心· 2025-06-04 09:22
本文作者分别来自新加坡国立大学、北京大学与清华大学。第一作者王宇豪与共同第一作者屈文杰来自新加坡国立大学,研究方向聚焦于大语言模型中的安 全与隐私风险。共同通讯作者为北京大学翟胜方博士,指导教师为新加坡国立大学张嘉恒助理教授。 本研究聚焦于当前广泛应用的 RAG (Retrieval-Augmented Generation) 系统,提出了一种全新的黑盒攻击方法: 隐式知识提取攻击 (IKEA) 。不同于以 往依赖提示注入 (Prompt Injection) 或越狱操作 (Jailbreak) 的 RAG 提取攻击手段, IKEA 不依赖任何异常指令,完全通过自然、常规的查询,即可高效 引导系统暴露其知识库中的私有信息。 在基于多个真实数据集与真实防御场景下的评估中,IKEA 展现出超过 91% 的提取效率与 96% 的攻击成功率,远超现有攻击基线;此外,本文通过多项 实验证实了隐式提取的 RAG 数据的有效性。本研究揭示了 RAG 系统在表面「无异常」交互下潜在的严重隐私风险。 论文题目:Silent Leaks: Implicit Knowledge Extraction Attack on RAG S ...