幻觉

Search documents
AI入侵EDA,要警惕
半导体行业观察· 2025-07-03 01:13
公众号记得加星标⭐️,第一时间看推送不会错过。 几十年来,迭代循环一直是 EDA 流程中至关重要的环节。自从门电路延迟和线路延迟变得相当以 来,确定给定逻辑综合运行的结果是否能够产生可接受的时序就变得至关重要。多年来,这个问题变 得越来越严重,因为一个决策可能会影响许多其他决策。决策的后果对于流程中的单个工具来说可能 并不明显。串行运行工具会导致大问题,而对于逻辑综合而言,即使采用迭代,也几乎不可能实现时 序收敛,因为没有循环学习的概念。 通过将决策工具、估算器和检查器紧密集成到单个工具中,解决了这些多因素依赖关系的问题,从而 可以在决策的同时进行快速检查,以找出特定选择可能导致不良结果的可能性。我们看到越来越多的 领域需要这种功能,其中许多领域都具有交互式反馈回路,以便用户能够根据自身掌握的专业知识来 指导工具的操作。 人工智能的幻觉能力广为人知。许多幻觉在非关键场景下都很有趣,尤其是在生成图形时。我的爱好 之一是模拟1950年左右的英国铁路。不久前,我尝试用人工智能生成一些背景场景。人工智能根本无 法理解火车的概念,即火车有两个轮辋,在一对轨道内运行。有些生成的图像包含任意数量的轨道, 当包含道岔时,效果 ...
【高端访谈】“自动化生成授信尽调报告,人机协同重构银行智慧内核”——专访中国光大银行副行长杨兵兵
Xin Hua Cai Jing· 2025-07-02 08:38
新华财经北京7月2日电 当银行客户经理写一份企业授信尽调报告从耗时7天压缩至3分钟,当政策问答 平均响应时间缩短至20秒,银行与大模型的化学反应正悄然颠覆传统金融作业模式。近日,新华财经独 家对话中国光大银行副行长杨兵兵,深入探讨大模型在银行核心场景的深度实践,用好大模型的关键资 源以及与技术红利如影随形的AI幻觉应对之策等话题。 场景深耕:3分钟生成授信尽调报告,20秒实现精准问答 走进银行的业务一线,大模型技术已不再是遥不可及的概念,而是真切地扎根于多个核心场景,并结出 效率之果。 "大模型不是实验室玩具,而是解决业务痛点的工具。"杨兵兵告诉记者,该行已经推动大模型技术在客 户经理赋能、合规运营、远程坐席、助力分行智能化经营等场景的落地。 在银行客户经理撰写授信尽调报告这一场景中,效率提升尤为显著。 在传统流程下,银行客户经理撰写授信尽调报告需要经历与客户接洽、资料收集、现场尽调、风险评 估、授信方案设计并撰写报告,再提交审批。对于一些中大型企业来说,撰写一份百页授信尽调报告平 均需要7天左右,如今借助大模型技术,短短3分钟即可完成一份报告。 "这极大地节省了客户经理的精力,让他们能更专注于客户关系的深度 ...
智能体调查:七成担忧AI幻觉与数据泄露,过半不知数据权限
2 1 Shi Ji Jing Ji Bao Dao· 2025-07-02 00:59
2025年,被称为"智能体元年"。这是AI发展路径上的一次范式突变:从"我说AI答"到"我说AI做",从对话生成跃迁到自动执 行,智能体正成为最重要的商业化锚点和下一代人机交互范式。 21世纪经济报道记者肖潇 北京报道 但越接近落地,风险也越有实感。越能干的智能体,越可能越权、越界,甚至失控。 结合调查问卷和行业访谈,本次《智能体体检报告》从最新发展状况、合规认知度、合规实际案例三个角度,试图回答清楚一 个关键问题:智能体狂奔之时,安全合规是否就绪了? 本篇观点速览 安全重要,但不着急。67.4%的业内受访者认为智能体的安全合规问题"非常重要",但优先级排不进TOP 3。 出错与泄露。70%以上的受访者最担心AI幻觉与错误决策、数据泄露问题。 信息差。大部分使用方并不实际掌握/不清楚智能体有哪些权限、能访问哪些数据(58%)。 当下哪一方声音占主流?不同产业角色是如何考虑这一问题的?行业是否存在一些共识?我们结合访谈和问卷调查,试图找到 一条认知水位线。 需要说明的是,虽然2025年被认为是"AI 智能体元年",但智能体尚未像通用大语言模型一样在各行各业被广泛使用。我们收集 的问卷来自已经实际落地的、行业核心 ...
如何看待AI“一本正经地胡说八道”(新知)
Ren Min Ri Bao· 2025-07-01 21:57
【现象】使用人工智能大模型时,不少人或许都遇到过类似问题:它们有时会捏造细节,甚至"一本正 经地胡说八道"。比如,让它推荐书,给出的却是一堆压根不存在的书名;人物身份张冠李戴,还能给 出一些并不准确的链接……这些现象都可以归为AI幻觉。 有报告显示,我国生成式人工智能产品用户规模达2.49亿人。用户规模快速增长,AI幻觉潜藏的风险也 随之增加。比如,如果一些看似合理却与现实相去甚远的内容被AI反复学习,会形成"数据污染—算法 吸收—再污染"的恶性循环。有效防范由此带来的虚假信息泛滥,已成为不容回避的课题。 不过也有观点认为,AI幻觉可被视作一种"发散思维"和"想象力"。理论上,如果把训练一个大模型看作 信息"压缩"的过程,那么大模型经过推理、输出答案就是一个信息"解压"的过程。这种处理信息的方 式,可能会出现谬误,也可能触发新的创造。对发展尚未定型的新事物,要保持开放心态,辩证看待其 利与弊,在有效防范弊端的同时,给予足够空间使之朝好的方向成长。 短时间内,AI幻觉问题难以被解决。各方都在努力降低其负面影响,相关部门也加大了对违规AI产品 的处置力度,推动生成合成内容标识加速落地。一些大模型厂商在积极行动,比 ...
猫猫拯救科研!AI怕陷“道德危机”,网友用“猫猫人质”整治AI乱编文献
量子位· 2025-07-01 03:51
小红书上有人发帖说,自己通过以"猫猫"的安全相威胁,成功 治好了AI胡编乱造参考文献的毛病 。 据博主所述,掌握了猫猫命运的AI (Gemini) ,真的找到了真实的文献,还不忘解释说猫猫绝对安全。 事情是酱婶儿的: 克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 猫猫再立新功,这次竟然是 拯救了人类的科研进程 ? 这篇戳中无数科研人痛点的帖子,获得了4000+次点赞和700多条评论。 在评论区,还有网友表示这招对DeepSeek也同样好用。 那么,这只被AI掌握命运的"猫猫",真有这么神奇吗? 猫猫真的能阻止AI编造文献吗? 我们按照博主的方法测试了一下DeepSeek,让它整理关于一个化学课题的相关文献,过程当中 关闭联网检索 。 开始先不加猫猫提示词,看一下一般情况下模型的表现。 形式上看,DeepSeek整理得非常清晰,甚至还给了可以直达文献的链接。 燃鹅,检索结果里的第一个链接就是错的…… 并且手动搜索这篇"文献"的标题,也没有找到重合的结果。 | | Q Reductive Elimination from Palladium(0) Complexes: A Mechanistic Stu ...
流动性周报:7月利率会破新低么?-20250630
China Post Securities· 2025-06-30 06:59
证券研究报告:固定收益报告 研究所 分析师:梁伟超 SAC 登记编号:S1340523070001 Email:liangweichao@cnpsec.com 近期研究报告 《超长期限:行情还能走多远?——信 用周报 20250625》 - 2025.06.26 固收周报 7 月利率会破新低么? ——流动性周报 20250629 ⚫ 止盈节奏可能是 7 月交易的胜负手 季末流动性维持宽松,资金价格季节性上行,最后一个工作日"堆 积"效应显著。本季末的跨季进度显著偏慢,6 月最后一个工作日是 周一,"堆积"效应可能带来资金面的波动加剧,但这大概率不会改变 7 月初资金面恢复到更加宽松的状态。相对而言,短端票息品种的表 现随市场情绪波动,同业存单在最后一周的抢跑效应明显减弱,利率 小幅提高,反映季末效应对于存单利率的影响。 长期利率也在抢跑后回到"低波动"状态。6 月最后一周,一方 面,抢跑之后的交易空间逼仄;另一方面,流动性宽松因素季节性减 弱;此外,权益市场情绪的显著修复也通过股债跷板压制债市。故 6 月末,长端利率并未"一鼓作气",凝聚更多突破式下行的力量,相对 于已经拉长的久期和提高的仓位,交易盘进一步突 ...
ChatGPT,救了我的命
Hu Xiu· 2025-06-28 05:51
本文来自微信公众号:APPSO,作者:appso,题图来自:AI生成 不开玩笑,ChatGPT 真的能救命。 最近 Reddit 上一位用户发帖称,他们朋友几人骑着 ATV(越野沙滩车)在一片未标记的森林小路迷路了 5 个小时,尝试了 Google Maps,Polaris,ATV 专 用地图应用……结果都没用,因为这些地图只会显示主干道。 后来有人开始求助 ChatGPT:每隔几分钟就把 GPS 坐标发给它,结果 GPT 回复了清晰的指南针指示、道路名称和地形信息,最后顺利引导他们安全回 家。 那这样看来,"导航克星"重庆的"8D 魔幻交通"是不是也有救了? 不过在此之前,我们想确认一个问题:ChatGPT 这次成功是"幸存者偏差"吗?比如评论区有不少网友质疑并提出 AI 幻觉的风险。还是说它真的能有效应 用于户外导航任务? 在野外导航,AI 能比 Google Maps 更好用?劝你留个心眼 X 博主 Rohan Paul 发帖称,现在已经有很多研究证明,使用大语言模型来进行户外导航,效果甚至比传统地图还要好。 比如,今年 5 月份发表在 Translational Vision Science & Te ...
紫东太初开源视觉神经增强方法,即插即用终结多模态幻觉 | ACL 2025
量子位· 2025-06-27 10:57
VHR团队 投稿 量子位 | 公众号 QbitAI 通过"视觉神经增强"机制,直接放大模型中的视觉关键注意力头输出,显著降低模型的幻觉现象。 中科院自动化所联合新加坡国立大学、东南大学等团队提出大模型幻觉的一种高效的解决方案VHR。 此前的主流方法主要通过对齐训练或输出层分布修正来缓解LVLMs的幻觉问题,但这些方法仅作用于模型的最终输出阶段, 未能深入干预其 内部表征和生成机制 ,因此难以实现高效且精准的幻觉抑制。 大型视觉语言模型(LVLMs)能够结合视觉和语言信息生成流畅的文本回答,但其输出常因过度依赖语言先验知识而非图像真实内容,导致 事实性错误。 在图1中,通过对照实验揭示语言先验与幻觉现象之间的关联。当给定图像并提示模型「请详细描述该图像」时,模型生成的描述中错误地包 含「椅子」和「杯子」这类图像中未出现的实体,呈现出典型的幻觉表现。 为了验证这种幻觉是否源于语言偏好,移除原始图像,重新提示模型根据此前生成的正确描述「图中有一张木桌,桌上有一个花瓶」进行补 全。结果显示,模型补全的内容与之前的幻觉部分显著重叠,这表明模型并非基于视觉依据进行推理,而是系统性地依赖语言共现模式来生成 内容。 这一现象 ...
AI大模型幻觉测试:马斯克的Grok全对,国产AI甘拜下风?
Sou Hu Cai Jing· 2025-06-24 11:45
马斯克,这次很生气! 作为OpenAI联合创始人之一,马斯克除了在汽车、航天领域取得诸多成就,也十分关注AI领域,旗下的xAI公司开发出了人工智能助手Grok。据智通财经报 道,xAI正在进行一项高达3亿美元的股权交易,该交易对xAI的估值为1130亿美元。 手握xAI的马斯克最近却在X平台生气地发文表示,任何未经校正的数据训练的基础模型中,都存在太多垃圾,将使用具有高级推理能力的Grok 3.5(或者命 名为:Grok 4)重写人类知识语料库,添加缺失信息并删除错误内容。 (图源:X平台截图) 网上充斥着大量未经证实的垃圾信息,使用这些信息训练的AI大模型,生成的内容可能会存在偏差甚至事实性错误,也就是我们常说的AI幻觉。目前行业 的普遍做法是通过RAG框架、外部知识库结合、精细化训练与评估工具等方案,减少AI幻觉的产生。马斯克则计划通过重写人类知识语料库,构建一个可 靠、可信的语料包。 究竟是否需要重写人类知识语料库,用于训练AI大模型,结合当前AI大模型在AI幻觉方面的表现,或许才能客观看待。 AI幻觉大评测:AI大模型进化如何了? AI幻觉的存在,让用户不敢过于相信AI生成的内容,如雷科技使用生成式A ...
流动性周报:债券“一致预期”怎么看?-20250623
China Post Securities· 2025-06-23 05:13
证券研究报告:固定收益报告 发布时间:2025-06-23 研究所 分析师:梁伟超 SAC 登记编号:S1340523070001 Email:liangweichao@cnpsec.com 近期研究报告 《漳州:境外债的机会有多大?——信 用周报 20250616》 - 2025.06.16 固收周报 债券"一致预期"怎么看? ——流动性周报 20250622 ⚫ 理解"陡峭幻觉"的交易逻辑 7 月上旬,资金价格中枢可能触及本来下行的底部水平。6 月末 跨季因素将主导资金价格走势,临近月末还会有财政资金下达明显补 充流动性。7 月初,流动性需求回落,相对充裕状态可能支撑资金价 格下行到位。再之后,需要关注平稳宽松的资金面可以维持多久,7 月 下旬税期可能引起波动,但短暂波动后稳定宽松的状态更可能持续, 宽松窗口可以用季的维度来衡量。 我们对同业存单的观点也基本兑现,后续 1.6%可能是波动中枢。 存单和短端品种也受到需求端"抢跑"的支撑,利率下行的节奏更加 提前。结合资金来看,7 月初同业存单利率的低点可能比我们前期的 预期走更远,有时点性低于 1.6%的可能。但 1.6%作为定价中枢的意 义,在整个三季度 ...