Workflow
AI大模型幻觉测试:马斯克的Grok全对,国产AI甘拜下风?
Sou Hu Cai Jing·2025-06-24 11:45

马斯克,这次很生气! 作为OpenAI联合创始人之一,马斯克除了在汽车、航天领域取得诸多成就,也十分关注AI领域,旗下的xAI公司开发出了人工智能助手Grok。据智通财经报 道,xAI正在进行一项高达3亿美元的股权交易,该交易对xAI的估值为1130亿美元。 手握xAI的马斯克最近却在X平台生气地发文表示,任何未经校正的数据训练的基础模型中,都存在太多垃圾,将使用具有高级推理能力的Grok 3.5(或者命 名为:Grok 4)重写人类知识语料库,添加缺失信息并删除错误内容。 (图源:X平台截图) 网上充斥着大量未经证实的垃圾信息,使用这些信息训练的AI大模型,生成的内容可能会存在偏差甚至事实性错误,也就是我们常说的AI幻觉。目前行业 的普遍做法是通过RAG框架、外部知识库结合、精细化训练与评估工具等方案,减少AI幻觉的产生。马斯克则计划通过重写人类知识语料库,构建一个可 靠、可信的语料包。 究竟是否需要重写人类知识语料库,用于训练AI大模型,结合当前AI大模型在AI幻觉方面的表现,或许才能客观看待。 AI幻觉大评测:AI大模型进化如何了? AI幻觉的存在,让用户不敢过于相信AI生成的内容,如雷科技使用生成式A ...