幻觉

Search documents
记住你终将死去,是避免内耗的最好方法
3 6 Ke· 2025-06-10 04:19
除了生死,别无大事。 为什么说对"生死"的深刻意识(不是恐惧!),反而是一个人觉醒、蜕变、真正开始"活明白"的必经之路? "活在当下"这句被说烂了的话,到底怎么才算真做到? 如何实现不被情绪绑架的"情绪自由"? 更关键的是,这三者——"生死意识"、"活在当下"、"情绪自由"——如何共同驱动我们走向更清醒、更自由、更有力量的人生? 一、生死意识:成长的终极"催化剂"与"清醒剂" "生死之外无大事"这句话,不是消极躺平的口号。 深刻理解并内化"生死"的边界感,是一个人真正觉醒、爆发出成长动力的起点。 为什么会这样? 因为人骨子里有个根深蒂固的"bug":我们天然地活在一种"永生幻觉"里。 你想想看: 那个"明天开始减肥"的明天,是不是总在延期? 那个"等有空了再陪家人"的空闲,是不是永远没等到? 那个"条件成熟了再启动一件事"的成熟点,是不是总在移动? 我们潜意识里总觉得自己"还有大把时间"。 死亡?那似乎是极其遥远、只发生在新闻里或别人身上的事情。 这种对生命有限性的集体性回避,心理学家称之为"死亡否认"。它带来的直接后果就是:拖延、懈怠、对当下价值的无限度打折。我们把最珍贵的"现 在",廉价地抵押给了一个想象 ...
DeepSeek R1幻觉率降低,用户喊话:想要R2
第一财经· 2025-05-29 15:13
2025.05. 29 本文字数:1440,阅读时长大约2分钟 导读 :报告显示此前 R1模型幻觉率在21%左右。 作者 | 第一财经 刘晓洁 在开源平台HuggingFace上发布R1模型的更新后,5月29日晚,DeepSeek终于发布了官方公告介绍这 次版本的具体能力迭代细节,其中包括深度思考能力强化、幻觉改善和创意写作更好等。 leepSeek ? deepseek ai DeepSeek-R1-0528 is here! Try it now: chat.deepseek.com No change to API usage - docs here: api- docs.deepseek.com/guides/reasoni ... o Open-source weights: huggingface.co/ deepseek-ai/De ... 排详帖- | 排名 | 模型名称 | 机构 | 准确率 | 幻觉率 | | --- | --- | --- | --- | --- | | | | | (%) | (%) | | હિર્દ | doubao-1.5-pro-32k | 字节跳动 | 95. ...
DeepSeekR1幻觉率最高降低50%,用户喊话想要R2模型
Di Yi Cai Jing· 2025-05-29 14:10
报告显示此前 R1模型幻觉率在21%左右。 在开源平台HuggingFace上发布R1模型的更新后,5月29日晚,DeepSeek终于发布了官方公告介绍这次版本的具体能力迭代细节,其中包括深度思考能力强 化、幻觉改善和创意写作更好等。 值得一提的是,DeepSeek提到,新版DeepSeek R1 针对"幻觉"问题进行了优化。与旧版相比,更新后的模型在改写润色、总结摘要、阅读理解等场景中,幻 觉率降低了 45%-50% 左右,能够提供更为准确可靠的结果。 所谓幻觉即大模型的"胡说八道",此前DeepSeek的幻觉率并不低,也被不少用户和开发者所讨论。5月15日,SuperCLUE曾发布最新一轮中文大模型忠实性 幻觉测评结果,显示此前的DeepSeek-R1模型幻觉率在21%左右,在测评的国内模型中排名第五。 doubao-1.5-pr 在测评数据上,官方表示,更新后的R1模型在数学、编程与通用逻辑等多个基准测评中取得了当前国内所有模型中首屈一指的成绩,并且在整体表现上已 接近其他国际顶尖模型,如 o3 与 Gemini-2.5-Pro。 gemini-2.5-pro-p1 gemini-2.5-flash-t ...
国内60%AI应用背后的搜索公司,怎么看AI幻觉问题?|AI幻觉捕手
2 1 Shi Ji Jing Ji Bao Dao· 2025-05-23 00:08
21世纪经济报道记者肖潇 北京报道 所谓"AI幻觉"——AI一本正经地胡说八道,已成为行业热词。它常被归因为大模型生成机制的天然缺 陷、训练数据的有限,但在一系列技术解释之外,一个环节鲜少被讨论:搜索。 联网搜索如今几乎是每个AI通用聊天产品的标配,它承担着为AI补充"最新知识"的任务。如果把AI联 网回答的过程比喻为做菜,大模型是厨师,搜索引擎就是食材供应商。一道菜的风味如何,厨师水平固 然重要,但食材同样关键。 在我们此前对AI幻觉的实测中,"食材"环节存在不少问题:失真信息、自媒体二手资料、人工智能生成 内容被反复引用……为什么准确信息难被引用到?AI依据哪些标准在互联网中挑选信息?(详见: 《让AI查了330次新闻:平均准确率25%,近一半链接打不开》) 21世纪经济报道:"AI+搜索"相当于给AI外挂了一个动态更新的数据库,这一概念刚兴起时,很多人期 待它能从源头解决AI胡编乱造的问题,但现在幻觉情况依然常见。作为AI搜索能力的提供方,你们会 如何看待AI幻觉问题?原因出在哪里? 翁柔莹:本质上这是信息来源的问题,你去百度、谷歌、必应搜索,会发现里面也有很多不实信息。虽 然传统搜索引擎和AI搜索引擎 ...
医疗影像大模型,还需“闯三关”
3 6 Ke· 2025-05-18 23:14
在众多应用场景中,因病理图像具有非常大的多样性,病理大模型也被认为是医疗模型"皇冠上的明 珠"。为破解病理诊断准确性与效率难题,透彻未来研发了全球首个临床应用级病理大模型产品——透 彻洞察,基于亿级参数量和海量高精度病理数据训练,为病理医生提供精准稳健、全面快速的病理临床 诊断辅助。 2025年以来,Deepseek通过开放生态加速了算法研发与临床场景的深度融合。医疗大模型摒弃了"技术 至上"的思维,逐渐进入实用主义阶段。作为AI应用最为深入的领域之一,医学影像在大模型时代迎来 了更快速的发展。 如何增强AI模型泛化能力?大模型幻觉问题如何解决?大模型多模态数据整合的难点及解决方案有哪 些?动脉网与数坤科技首席技术官郑超、透彻未来联创兼首席技术官王书浩这两位深耕医疗AI多年的 专家们聊了聊,供行业参考。 本文主要观点如下: 01 大模型已深入医生全工作流程 医学影像人工智能模型在参数规模未达当前水平时便展现出了广阔的应用前景,现已在影像科医生的工 作全流程中实现了常态化应用。而在辅助诊断专用模型之后,数坤科技在4月发布的"数坤坤多模态医疗 健康大模型",便实现了让AI从辅助工具进化为诊疗生态的核心驱动力。 数 ...
巴菲特刚退休,他的 “替身” 就来帮大家炒股了?
Sou Hu Cai Jing· 2025-05-18 16:18
就在大家伙儿欢乐过五一的时候,94 岁高龄的 "劳模" 巴菲特突然宣布要退役了。 不过,虽然股神年龄大了要退役,他的灵魂可以一直在。 Github 上有个名叫 Virattt 的老兄,做出了一款各路股神的灵魂提取器 —— AI Hedge Fund。 反正不管是还在的,还是已经不在的,都能捞过来给咱打工。 在迫切的发财需求推动下,项目一经推出就收获了万星点赞。 AI Hedge Fund 目前一共提供 9 位明星投资人的策略,不仅有各位差友最熟悉的巴菲特,连他的老师 Graham 和 Fisher 都名列其中。 大家纷纷留言: "这个程序在A股能不能用啊?" "有没有人试过,到底表现咋样?" 和钱相关的事儿,光听别人说也不靠谱,还是得咱自己亲手来试试。 于是我们花了不少时间配置好 Linux 环境,试跑了程序进行测试。 赶在放假前,我们让程序根据 4 月 30 号之前的股票信息,预测一下 4 月 30 号到 5 月 5 号的交易策略,咱 6 号再回来验证它说的准不准。 所以测试保证真实,绝对不存在事后诸葛亮的问题。 一通操作下来,只能说,股神发力确实猛。这个假期如果按照 AI 预测做空苹果一百万,粗略点算,能 ...
整理:昨日今晨重要新闻汇总(5月18日)
news flash· 2025-05-18 00:17
金十数据整理:昨日今晨重要新闻汇总(5月18日) 国内新闻: 10. 以方称哈马斯愿意释放部分人员换取两个月停火。 1. 朱雀二号改进型遥二运载火箭发射成功。 2. 央视:歼-10CE首次实战大放异彩,引发全球军事爱好者的高度关注。 3. 5月19日至20日,深交所将在深圳举办2025全球投资者大会。 4. 天津:引导社会资本面向AI领域设立天使投资基金、创业投资基金。 5. 蚂蚁集团CTO何征宇: 大模型幻觉的源头是缺乏数据。 6. 3月中国减持189亿美元美债、持仓规模降至第三,英国升至第二。 7. 宁德时代:山东时代电池生产基地正式投产。 8. 广州房贷利率今起上调10BP,多家银行已执行。 1. 有关"普泽会",俄官方表示:有可能。 2. 特朗普:将于周一上午10点与普京通话。 3. 特朗普称若不能就乌克兰问题达成协议会对俄实施"破坏性"制裁。 4. 乌称苏梅州一公共汽车遭俄军袭击,致9死4伤。 5. 哈马斯与以色列举行新一轮加沙停火谈判。 6. 美国提议对非公民汇款征收5%的税。 7. 秘鲁中部发生6.0级地震,震源深度100千米。 8. 欧洲央行施纳贝尔:应在利率举措上保持谨慎。 国际新闻: 9. ...
AI Agent:模型迭代方向?
2025-05-06 02:28
AI Agent:模型迭代方向?20250503 摘要 • AI 商业化进展缓慢,To B 端尤为明显,微软 Copilot 未达预期,OpenAI 产品仍以 chatbot 为主,未进入 agent 阶段。Agent 准确率受限于大模 型能力,工程化手段成为完善产品的重要途径。 • Deepseek Prover V2 版本为解决 agent 产品化问题提供新思路,其核 心作者已公开相关信息,并在 GitHub 上提供论文,为提升 agent 执行复 杂任务的准确率提供了新的方向。 • OpenAI 和 Anthropic 在 autonomous AI system 研究方面均有进展, Anthropic 在技术积累上更超前,其 ComputeUse 系统运行时间早于 OpenAI 相应产品至少一个季度,在 agent 产品化和模型能力方面 Anthropic 或更具优势。 • 大型科技公司通过技术研发和工程化手段推动大模型发展, Deepseek、OpenAI 和 Anthropic 专注于技术研发,其他公司则采用工 程化手段完善产品,共同促进下一代 AI 产品的发展。 • Chatbot 和 Agen ...
停止做这 7 件事,升级你的大脑
3 6 Ke· 2025-05-03 00:03
神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技 术、新观点、新风向。 编者按:大脑的功能依赖于你的习惯。养成好习惯,做正确的事情,你就能让大脑变得功能更强大。本 文来自编译,希望对你有所启发。 你的大脑在寻找什么,你的眼睛就只能看到什么,你的耳朵就只能听到什么。——丹·沙利 文(Dan Sullivan) 大脑是一个神奇的工具,它会找到你要找的东西。你可以通过大脑改变自己,可以用大脑赋予自己目前 完全无法理解的技能、语言和能力。 你的大脑也会陷入非常缓慢的节奏中。如何运用大脑取决于你自己。 如果我们开始做对了,就很容易一直做对;但是,如果我们一开始就错了,那么就可能就会 一直走错,而且很难纠正过来。——小约瑟夫·史密斯(Joseph Smith, Jr.) 破坏大脑的第一个有毒的、破坏性的习惯就是开始太慢。 大多数人的大脑都被训练得很迟钝。 想想你一天开始时的大脑。 很有可能一大早你的思维就卡住了。当你的大脑习惯于慢下来时,就不可能进入心流状态。 大多数人开始做任何事都很慢。因为我们的社会习惯了消费,大多数人早上都在用手机消费。正因为如 此,他们在一天中永远不会进入"心流"状 ...
李彦宏说 DeepSeek 幻觉高,是真的吗?
3 6 Ke· 2025-05-02 04:29
李彦宏点名批评DeepSeek幻觉高。这回,他真的没错。但大模型的幻觉问题,又远非错与对那么简单。 DeepSeek-R1作为今年年初的新晋国产开源大模型,以强大的推理能力和更懂国人的文笔,在苹果美区App免费下载排行榜上力压ChatGPT一头,甚至一 度成为"AI"的代言词。 然而,自从R1席卷全网后,关于它经常"胡说八道"的批评就不绝于耳,比如它实在太能编了,让人真真假假分不清。 除了用户端之外,李彦宏及其代表的大厂们也"苦"DeepSeek已久:一方面,大厂不得不依赖DeepSeek的泼天流量导入自身门户入口;另一方面,尽管投入 大量人力物力研发深度推理模型,其成果却难以突破用户心智。 在2025百度AI开发者大会的开幕上,李彦宏直接点出全民AI大模型 DeepSeek-R1 的痛点:"只支持单一模态、幻觉率较高、又慢又贵"。一番犀利评论, 再度引发了各界对DeepSeek-R1以及大模型"幻觉"的评议。 但出现强烈幻觉的并不止DeepSeek一家,OpenAI在其内部测试中发现:o3/o4-mini虽然全面替换了o1系列,但是幻觉现象越来越强了;国内第一个混合推 理模型——阿里通义的Qwen3也在X上 ...