引文幻觉大幅下降的AI模型诞生
Ke Ji Ri Bao·2026-02-04 23:03

团队总结道,以上结果和引文幻觉大幅下降证明了"OpenScholar"有望支持和推动进一步研究工作。但 他们指出,该系统仍有局限性并强调基于语言模型的系统无法使科学文献综述完全自动化。他们向学界 同时开放"ScholarQABench"和"OpenScholar",以鼓励进一步研究和优化。 【总编辑圈点】 科研人员每天寻找有用的论文,相当于在信息的"海洋"里捞"珍珠"。但现在海水暴涨,真正有用之物和 以假乱真之物一起浮上了水面。以前大家用的是通用的"万能捞网",比如GPT。但它的网眼太大,捞上 来的有可能是"塑料珠子",也就是假的或错误的引文,需花大量时间去挑,还可能会被误导。本文中 的"OpenScholar",是一个专门为这片科学海洋设计的网。它不追求万能,而追求可靠,而且所有科学 家都能一起改进这个工具,让它更准确。这有望把科研人员从繁琐、易错的文献苦海中部分解放出来, 让他们能把宝贵精力用在真正的思考和发现上。这正是科学工具走向可信化的重要一步。 《自然》4日报道了一个开源语言模型"OpenScholar",其在准确进行文献综述方面可超越商用大语言模 型。比如,在该研究开展的实验中,GPT4o会在78 ...

引文幻觉大幅下降的AI模型诞生 - Reportify