AI 训练

Search documents
X @Yuyue
Yuyue· 2025-07-13 09:13
AI 模型聪明和不聪明的区别在我看来很多时候来源于数据集的差异。就像之前我对比过腾讯元宝和 deepseek 有关本地生活问题的回答可用性,发现腾讯元宝虽然内核还是 deepseek,但回答要比 deepseek 本体 “聪明” 很多,直接可以根据回答来使用究其本质,是因为腾讯元宝直接能调用大量来自微信公众号这一不算完全开放的数据库,在其中有大量自媒体分享的经验和观点。可想而知,如果小红书能做一个 AI,在生活经验上可能比腾讯元宝更牛逼一点这一问题证明了高质量数据的重要性。AI 固然能帮人找到哪里的餐厅好吃,餐厅的联系方式是什么,但只有人类能原创创造出餐厅,创造性仍然是 AI 做不到的而这两天 Tiger Research 的报告中正是提到了数据领域的危机,由于 AI 内容的泛滥,优质数据资源可能面临枯竭,这将对依赖数据驱动的 AI 模型构成重大挑战。更棘手的是,许多用户创作的内容在未获许可的情况下被用于 AI 训练,而原作者往往无法获得认可或经济回报很多老师都在说 @campnetworkxyz 快发币了,这两天也看到不少 Camp 生态的相关动态,感觉是一个新版本的 $IP ...