24年大语言模型能力评析
中国银行·2024-05-17 06:33
Hello大家好我是投报研究院综合组分析师王丽华欢迎收看投报带你读研报栏目本期我们一起来讨论一下关于2024年中国代研模型能力评析及行业应用能力评测的结果首先我们先来看一下整体的它的一个评测结果分数情况从得分来看 文心语言通译签问和会员大模型得分均在7分以上可以看出文心语言通译签问以及会员大模型能够比较灵活地适应且高效地解决各行业的一个实际应用场景中所遇到的问题在多行业能力评测中表现优异而排名末位的大模型在面对大多数的行业 专业能力的一个表现情况处于一般水平从大模型优势行业分析情况来看在行业能力板块呢大模型所拥有的优势行业呈现比较明显的特征头部的大模型在多个行业中表现出领先优势就比如 文心语言通译签问拥有超过10个以上的一个优势行业但排名末位的一个大模型的行业能力仍处于需要进一步提升的状态接着我们来看它的一个细分维度从专业知识储备的维度评测结果来看文心语言混元以及通译签问还有 商汤商量以及360智能它的一个得分情况是超过了一个国际均分但在中国仍有部分的弹幕性表现一般主要集中在专业知识储备能力仍有待提升具体来看呢我先严肃一切问商汤商量以及360智能之所以能够达到如此高的一个知识储备水平 背后其实是含量的数据支撑 ...