Workflow
大语言模型
icon
Search documents
榜单更新,字节Seed2.0表现亮眼,我们还测了爆火的龙虾 |xbench 月报
红杉汇· 2026-03-04 02:49
春节期间,多家公司发布的最新模型,xbench都进行了评测,并对leaderboard进行了更新。xbench最新发布的多 模态理解benchmark BabyVision,已被近期发布的多款模型产品纳入评测体系;包括seed-2.0、Qwen3.5、Kimi K2.5在内的项目均在其公开发布的技术报告中引用了Babyvision,体现出社区对该Benchmark的持续关注与广泛 采用。 xbench采用长青评估机制,持续汇报最新模型的能力表现,更多榜单未来将陆续更新,期待你的关注。你可以 在xbench.org上追踪我们的工作和查看实时更新的Leaderboard榜单排名;欢迎通过team@xbench.org与我们取得联 系,反馈意见。 xbench-ScienceQA Leaderboard更新 | | 模型名 | API | 模式 | 公司 | 本视台 | BoN | 平均响应时间 | input cost | output cost | 发布时间 | 测评时间 | | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | ...
阿里千问大模型换将,32岁林俊旸官宣告别
量子位· 2026-03-04 01:33
阿 里巴巴 高级算法专家 、通义千问 大模型负责人林俊旸 在X平台发文 ,离开 千问团队 。 而就在此前一晚,千问团队刚刚重磅推出了Qwen3.5轻量化模型,总共0.8B、2B、4B、9B四个版本,均开源可商用。 △ 图片源自通义实验室公众号 并且,团队的工作还得到了马斯克的点赞。 林俊旸的上一条动态,还停留在相关讨论的回复中。 西风 发自 凹非寺 量子位 | 公众号 QbitAI 刚被马斯克夸完,千问大模型负责人就宣布告别千问了。 | Junyang Lin � ☞ @JustinLin610 · 8h | | | | | --- | --- | --- | --- | | me stepping down. bye my beloved qwen. | | | | | Ο 1κ | t7 732 | ( 7.6K | 111.9M | | Junyang Lin � @ @JustinLin610 · Mar 3 | | | | | thx elon! | | | | | Elon Musk � █ @elonmusk · Mar 2 | | | | | Replying to @Alibaba Qwen ...
理想用四组数学公式分享对自动驾驶芯片软硬协同设计的理解|能看懂
理想TOP2· 2026-03-01 08:36
读者不用被里面的数学公式吓到,TOP2做了详细解释,多看几遍能看懂的。 2026年2月10日理想发布Hardware Co-Design Scaling Laws via Roofline Modelling for On-Device LLMs(基于Roofline建模的端侧大语言模型硬件协同设计 Scaling Laws) 论文标题说的是硬件协同设计,不是软硬件协同设计,这是因为论文中协同的两方并非传统意义上的软件团队和硬件团队。协同的是AI模型的架构参数 (比如模型多少层、每层多宽、用多少专家)和芯片的硬件特性(比如峰值算力多大、内存带宽多快、总内存多少)。 论文的核心工作是将硬件的物理约束用数学公式表达出来,然后在这些约束下搜索最优的模型架构。所以Hardware Co-Design准确地说是将硬件特性纳入 模型设计的协同优化,而不是软件和硬件一起从零开始设计。 这篇论文实质讲的是如何在一颗给定的自动驾驶芯片上,找到一个AI大模型的最优架构设计方案。 芯片的算力是有限的,内存是有限的,数据搬运的速度也是有限的,但自动驾驶又要求模型既聪明又反应快。论文提出了一套数学框架,让工程师不需要 真的去训练成百上 ...
OpenClaw多平台部署与投研应用
GF SECURITIES· 2026-02-28 14:45
[Table_Page] 金融工程|专题报告 2026 年 2 月 28 日 证券研究报告 [Table_Title] OpenClaw 多平台部署与投研应用 [Table_Summary] 报告摘要: [分析师: Table_Author]安宁宁 SAC 执证号:S0260512020003 SFC CE No. BNW179 0755-23948352 anningning@gf.com.cn 分析师: 陈原文 SAC 执证号:S0260517080003 0755-82797057 chenyuanwen@gf.com.cn 请注意,陈原文并非香港证券及期货事务监察委员会的注 册持牌人,不可在香港从事受监管活动。 [联系人: Table_Contacts] 林涛 0755-82528531 gflintao@gf.com.cn 972918116公共联系人2026-02-28 22:30:36 识别风险,发现价值 请务必阅读末页的免责声明 1 / 25 图 1:OpenClaw 整体架构 数据来源:广发证券发展研究中心 ⚫ AI 投研应用:在 2025 年 2 月发布的研究报告《如何使用 DeepSee ...
【广发金工】OpenClaw多平台部署与投研应用
广发证券首席金工分析师 安宁宁 SAC: S0260512020003 anningning@gf.com.cn 广发证券联席首席金工分析师 陈原文 SAC: S0260517080003 chenyuanwen@gf.com.cn 联系人:广发证券金工高级研究员 林涛 SAC: S0260124060060 gflintao@gf.com.cn 广发金工安宁宁陈原文团队 摘要 AI投研应用: 在2025年2月发布的研究报告《如何使用DeepSeek提高投研效率——各类大语言模型在金融领域的应用综述》中,我们团队以45页长文系统性 地探讨了大语言模型在投研领域的应用前景。过去一年间,AI技术不断演进,各类旨在提升生产力的AI智能体(Agent)井喷式涌现。其中,近期备受瞩目且 广受好评的OpenClaw无疑是表现最为亮眼的佼佼者。本文旨在深入解析OpenClaw在多平台的具体部署方案,并全面展示其在实际投研场景中的进阶应用。 OpenClaw的优势: OpenClaw是新兴的AI智能体,能够无缝融入用户工作流,有效解决传统AI助手在交互、隐私与上下文方面的痛点。其核心优势主要体现 在四个维度:一是创新的跨平台 ...
大模型能力技术培训:让数据智能像水电 样简单
数巅科技· 2026-02-28 01:20
大模型能力技术培训 让数据智能像水电 样简单 语言模型发展历程 大语言模型:包含百亿或更多参数的语言模型 参考文献:https://arxiv.org/abs/2303.18223 • 上世纪90年代:语言模型出现,统计学方法,使用前面的词预测下一个词 • 2003年: Bengio 《A Neural Probabilistic Language Model》 ,首度将深度学习思想融入语言模型 • 2018年: Google提出Transformer神经网络架构, 并通过大量文本训练理解语言规则和模式 • 国外:GPT-3(175B) 、GPT-4 、PaLM(540B) 、Galactica 和 LLaMA 等 • 国内:ChatGLM、文心一言 、通义千问 、讯飞星火等 • 大语言模型和小语言模型(如GPT2)采用相似的架构和预训练任务,但是能力截然不同(涌现能力) • 涌现能力使得大语言模型只使用很少的样本就可以处理全新的任务 对技术领域的影响 对商业领域的影响 参考文献:https://arxiv.org/abs/2303.18223 • 自然语言处理:理解和生成文本,意图理解 、写文章 、 回答问 ...
贝索斯豪赌工业AI!旗下“普罗米修斯”启动百亿美元级融资
Hua Er Jie Jian Wen· 2026-02-27 13:09
杰夫·贝索斯(Jeff Bezos)旗下人工智能实验室正在寻求数百亿美元融资,计划打造一个专门收购受AI 技术影响的工业企业的控股平台。这是迄今为止押注AI颠覆实体经济的最大规模行动之一。 据英国《金融时报》报道,该项目代号为"普罗米修斯"(Project Prometheus),去年底已完成62亿美元 融资,据两名知情人士透露,此轮融资对应估值约为300亿美元(不含本轮新募资金)。 普罗米修斯的目标是构建超越大语言模型的新型AI系统,使其具备映射真实物理世界、理解设计与工 程原理的能力,贝索斯担任联席首席执行官。 将AI技术与传统产业并购相结合的思路并非贝索斯独创,但其规模远超同类。消息一出,市场对AI驱 动的工业并购浪潮的关注度再度升温。 贝索斯重回管理一线,主导工业AI战略 普罗米修斯由贝索斯与前谷歌高管Vikram Bajaj联合领导。贝索斯担任联席首席执行官,这是他自2021 年卸任亚马逊首席执行官以来首次出任管理职务,据知情人士称,他深度参与公司日常运营。 公司联合创始团队还包括前微软研究科学家Christian Bodnar,以及曾任职于谷歌DeepMind的Nal Kalchbrenner。 ...
别让AI痕迹出卖你:深挖AIGC率检测原理,实测主流“降AI率”方案
Xin Lang Cai Jing· 2026-02-27 04:58
当教授对着你的论文皱眉,当编辑将你的稿件标记为"疑似AI生成",背后是一套怎样的检测机制在运作?我们又该如何让AI助力的文字回归"人味"? 在人工智能文本生成技术飞速发展的今天,AIGC检测器已成为教育、出版和内容平台的标配工具。许多用户发现,即使经过人工修改的AI生成文本,仍可 能被系统标记为"非人类创作"。 这种"AI率"的高低究竟取决于什么?市面上那些声称能降低AI检测率的工具真的有效吗? 本文将深入解析AIGC检测的底层逻辑,并实测三类主流"降AI率"方法的实际效果。 一、大模型如何生成文本:为何AI总有"辨识度" 要理解AI文本为何能被检测,首先需要了解大语言模型的工作原理。与人类写作不同,AI生成文本遵循特定的概率模式,这种模式在文本的多个维度上留 下可辨识的"指纹"。 1. 基于概率的预测机制 大语言模型本质上是"下一个词预测器"。它们通过分析海量训练数据,学习词语之间的统计关系。当生成文本时,模型会根据前文计算每个可能出现的下一 个词的概率,然后选择概率最高的词(或按概率分布随机选择)。 这种机制导致AI文本在以下方面具有可检测特征: 词汇多样性受限:模型倾向于使用训练数据中高频出现的词汇组合 ...
天数智芯涨超20%刷新上市新高 通用GPU市场具备广阔发展前景
Zhi Tong Cai Jing· 2026-02-26 06:37
公开资料显示,天数智芯提供针对不同行业的通用GPU产品及AI算力解决方案。公司的产品组合主要 包括通用GPU芯片及加速卡,以及定制AI算力解决方案(包括通用GPU服务器及集群),天数智芯通用 GPU产品涵盖天垓及智铠系列,兼容国内外主流AI生态以及各类深度学习框架。今年1月,该公司公布 四代芯片架构路线图,预期于2027年超越英伟达Rubin架构;同时推出"彤央"系列边端算力产品。 消息面上,近年来,AI的发展,尤其是大语言模型的兴起,推动算力需求大幅增长。根据弗若斯特沙 利文的资料,中国通用GPU市场快速扩张,2024年的出货量达到1.6百万片,2022年至2024年的复合年 增长率为72.8%。预计市场将维持强劲增长,于2025年至2029年,出货量预计以33.0%的复合年增长率 增长。随着中国通用GPU公司出货量的增长速度超越国际竞争对手,国内市场占有率持续攀升。 天数智芯(09903)涨超20%,高见287港元刷新上市新高。截至发稿,涨19.52%,报285港元,成交额3.7 亿港元。 ...
计算机行业周报:LLaDA2.1实现技术突破,Gemini3.1Pro树立多模态新标准-20260225
Huaxin Securities· 2026-02-25 10:25
2026 年 02 月 25 日 LLaDA2.1 实现技术突破,Gemini3.1Pro 树立 多模态新标准 推荐(维持) 投资要点 分析师:任春阳 S1050521110006 rency@cfsc.com.cn 行业相对表现 表现 1M 3M 12M 计算机(申万) -5.4 5.5 3.4 沪深 300 0.7 5.5 20.6 市场表现 -30 -20 -10 0 10 20 30 (%) 计算机 沪深300 资料来源:Wind,华鑫证券研究 相关研究 1、《计算机行业周报:字节跳动 Seedance2.0 重 磅 上 线 , ClaudeOpus4.6 发布》2026-02-10 2、《计算机行业点评报告:亚马逊 (AMZN.O):AI 基础设施与零售网 络共振,资本开支周期驱动长期增 长》2026-02-08 3、《计算机行业点评报告:苹果 (AAPL.O):营收利润双增长, iPhone 与服务业务表现亮眼创历史 新高》2026-02-05 ▌ 算力:算力租赁价格平稳,扩散语言模型 LLaDA2.1 实现技术突破 2026 年 2 月,LLaDA2.1 扩散语言模型正式发布,含 160 亿、 ...