大语言模型 - filings, earnings calls, financial reports, news - Reportify

大语言模型

Search documents

榜单更新，字节Seed2.0表现亮眼，我们还测了爆火的龙虾｜xbench 月报

红杉汇· 2026-03-04 02:49

春节期间，多家公司发布的最新模型，xbench都进行了评测，并对leaderboard进行了更新。xbench最新发布的多模态理解benchmark BabyVision，已被近期发布的多款模型产品纳入评测体系；包括seed-2.0、Qwen3.5、Kimi K2.5在内的项目均在其公开发布的技术报告中引用了Babyvision，体现出社区对该Benchmark的持续关注与广泛采用。 xbench采用长青评估机制，持续汇报最新模型的能力表现，更多榜单未来将陆续更新，期待你的关注。你可以在xbench.org上追踪我们的工作和查看实时更新的Leaderboard榜单排名；欢迎通过team@xbench.org与我们取得联系，反馈意见。 xbench-ScienceQA Leaderboard更新 | | 模型名 | API | 模式 | 公司 | 本视台 | BoN | 平均响应时间 | input cost | output cost | 发布时间 | 测评时间 | | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | ...

多模态智能体

大语言模型

Artificial Intelligence

Doubao-Seed-2.0-pro

多模态智能体

大语言模型

Artificial Intelligence

Doubao-Seed-2.0-pro

阿里千问大模型换将，32岁林俊旸官宣告别

量子位· 2026-03-04 01:33

阿里巴巴高级算法专家、通义千问大模型负责人林俊旸在X平台发文，离开千问团队。而就在此前一晚，千问团队刚刚重磅推出了Qwen3.5轻量化模型，总共0.8B、2B、4B、9B四个版本，均开源可商用。 △ 图片源自通义实验室公众号并且，团队的工作还得到了马斯克的点赞。林俊旸的上一条动态，还停留在相关讨论的回复中。西风发自凹非寺量子位 | 公众号 QbitAI 刚被马斯克夸完，千问大模型负责人就宣布告别千问了。 | Junyang Lin � ☞ @JustinLin610 · 8h | | | | | --- | --- | --- | --- | | me stepping down. bye my beloved qwen. | | | | | Ο 1κ | t7 732 | ( 7.6K | 111.9M | | Junyang Lin � @ @JustinLin610 · Mar 3 | | | | | thx elon! | | | | | Elon Musk � █ @elonmusk · Mar 2 | | | | | Replying to @Alibaba Qwen ...

大语言模型

Artificial Intelligence

大语言模型

Artificial Intelligence

理想用四组数学公式分享对自动驾驶芯片软硬协同设计的理解|能看懂

理想TOP2· 2026-03-01 08:36

读者不用被里面的数学公式吓到，TOP2做了详细解释，多看几遍能看懂的。 2026年2月10日理想发布Hardware Co-Design Scaling Laws via Roofline Modelling for On-Device LLMs(基于Roofline建模的端侧大语言模型硬件协同设计 Scaling Laws) 论文标题说的是硬件协同设计，不是软硬件协同设计，这是因为论文中协同的两方并非传统意义上的软件团队和硬件团队。协同的是AI模型的架构参数（比如模型多少层、每层多宽、用多少专家）和芯片的硬件特性（比如峰值算力多大、内存带宽多快、总内存多少）。论文的核心工作是将硬件的物理约束用数学公式表达出来，然后在这些约束下搜索最优的模型架构。所以Hardware Co-Design准确地说是将硬件特性纳入模型设计的协同优化，而不是软件和硬件一起从零开始设计。这篇论文实质讲的是如何在一颗给定的自动驾驶芯片上，找到一个AI大模型的最优架构设计方案。芯片的算力是有限的，内存是有限的，数据搬运的速度也是有限的，但自动驾驶又要求模型既聪明又反应快。论文提出了一套数学框架，让工程师不需要真的去训练成百上 ...

自动驾驶芯片软硬协同设计

大语言模型

马赫100芯片

NVIDIA Jetson Orin平台

自动驾驶芯片软硬协同设计

大语言模型

马赫100芯片

NVIDIA Jetson Orin平台

OpenClaw多平台部署与投研应用

GF SECURITIES· 2026-02-28 14:45

[Table_Page] 金融工程|专题报告 2026 年 2 月 28 日证券研究报告 [Table_Title] OpenClaw 多平台部署与投研应用 [Table_Summary] 报告摘要： [分析师： Table_Author]安宁宁 SAC 执证号：S0260512020003 SFC CE No. BNW179 0755-23948352 anningning@gf.com.cn 分析师：陈原文 SAC 执证号：S0260517080003 0755-82797057 chenyuanwen@gf.com.cn 请注意，陈原文并非香港证券及期货事务监察委员会的注册持牌人，不可在香港从事受监管活动。 [联系人： Table_Contacts] 林涛 0755-82528531 gflintao@gf.com.cn 972918116公共联系人2026-02-28 22:30:36 识别风险，发现价值请务必阅读末页的免责声明 1 / 25 图 1：OpenClaw 整体架构数据来源：广发证券发展研究中心 ⚫ AI 投研应用：在 2025 年 2 月发布的研究报告《如何使用 DeepSee ...

大语言模型

软件和信息技术服务业

大语言模型

软件和信息技术服务业

【广发金工】OpenClaw多平台部署与投研应用

广发金融工程研究· 2026-02-28 14:41

广发证券首席金工分析师安宁宁 SAC: S0260512020003 anningning@gf.com.cn 广发证券联席首席金工分析师陈原文 SAC: S0260517080003 chenyuanwen@gf.com.cn 联系人：广发证券金工高级研究员林涛 SAC: S0260124060060 gflintao@gf.com.cn 广发金工安宁宁陈原文团队摘要 AI投研应用：在2025年2月发布的研究报告《如何使用DeepSeek提高投研效率——各类大语言模型在金融领域的应用综述》中，我们团队以45页长文系统性地探讨了大语言模型在投研领域的应用前景。过去一年间，AI技术不断演进，各类旨在提升生产力的AI智能体（Agent）井喷式涌现。其中，近期备受瞩目且广受好评的OpenClaw无疑是表现最为亮眼的佼佼者。本文旨在深入解析OpenClaw在多平台的具体部署方案，并全面展示其在实际投研场景中的进阶应用。 OpenClaw的优势： OpenClaw是新兴的AI智能体，能够无缝融入用户工作流，有效解决传统AI助手在交互、隐私与上下文方面的痛点。其核心优势主要体现在四个维度：一是创新的跨平台 ...

GF SECURITIES(SZ:000776)

大语言模型

大语言模型

大模型能力技术培训：让数据智能像水电样简单

数巅科技· 2026-02-28 01:20

大模型能力技术培训让数据智能像水电样简单语言模型发展历程大语言模型：包含百亿或更多参数的语言模型参考文献：https://arxiv.org/abs/2303.18223 • 上世纪90年代：语言模型出现，统计学方法，使用前面的词预测下一个词 • 2003年： Bengio 《A Neural Probabilistic Language Model》，首度将深度学习思想融入语言模型 • 2018年： Google提出Transformer神经网络架构，并通过大量文本训练理解语言规则和模式 • 国外：GPT-3（175B）、GPT-4 、PaLM（540B）、Galactica 和 LLaMA 等 • 国内：ChatGLM、文心一言、通义千问、讯飞星火等 • 大语言模型和小语言模型（如GPT2）采用相似的架构和预训练任务，但是能力截然不同（涌现能力） • 涌现能力使得大语言模型只使用很少的样本就可以处理全新的任务对技术领域的影响对商业领域的影响参考文献：https://arxiv.org/abs/2303.18223 • 自然语言处理：理解和生成文本，意图理解、写文章、回答问 ...

大语言模型

分布式训练

Artificial Intelligence

大语言模型

分布式训练

Artificial Intelligence

贝索斯豪赌工业AI！旗下“普罗米修斯”启动百亿美元级融资

Hua Er Jie Jian Wen· 2026-02-27 13:09

杰夫·贝索斯（Jeff Bezos）旗下人工智能实验室正在寻求数百亿美元融资，计划打造一个专门收购受AI 技术影响的工业企业的控股平台。这是迄今为止押注AI颠覆实体经济的最大规模行动之一。据英国《金融时报》报道，该项目代号为"普罗米修斯"（Project Prometheus），去年底已完成62亿美元融资，据两名知情人士透露，此轮融资对应估值约为300亿美元（不含本轮新募资金）。普罗米修斯的目标是构建超越大语言模型的新型AI系统，使其具备映射真实物理世界、理解设计与工程原理的能力，贝索斯担任联席首席执行官。将AI技术与传统产业并购相结合的思路并非贝索斯独创，但其规模远超同类。消息一出，市场对AI驱动的工业并购浪潮的关注度再度升温。贝索斯重回管理一线，主导工业AI战略普罗米修斯由贝索斯与前谷歌高管Vikram Bajaj联合领导。贝索斯担任联席首席执行官，这是他自2021 年卸任亚马逊首席执行官以来首次出任管理职务，据知情人士称，他深度参与公司日常运营。公司联合创始团队还包括前微软研究科学家Christian Bodnar，以及曾任职于谷歌DeepMind的Nal Kalchbrenner。 ...

大语言模型

超越大语言模型的新型AI系统

大语言模型

超越大语言模型的新型AI系统

别让AI痕迹出卖你：深挖AIGC率检测原理，实测主流“降AI率”方案

Xin Lang Cai Jing· 2026-02-27 04:58

当教授对着你的论文皱眉，当编辑将你的稿件标记为"疑似AI生成"，背后是一套怎样的检测机制在运作？我们又该如何让AI助力的文字回归"人味"？在人工智能文本生成技术飞速发展的今天，AIGC检测器已成为教育、出版和内容平台的标配工具。许多用户发现，即使经过人工修改的AI生成文本，仍可能被系统标记为"非人类创作"。这种"AI率"的高低究竟取决于什么？市面上那些声称能降低AI检测率的工具真的有效吗？本文将深入解析AIGC检测的底层逻辑，并实测三类主流"降AI率"方法的实际效果。一、大模型如何生成文本：为何AI总有"辨识度" 要理解AI文本为何能被检测，首先需要了解大语言模型的工作原理。与人类写作不同，AI生成文本遵循特定的概率模式，这种模式在文本的多个维度上留下可辨识的"指纹"。 1. 基于概率的预测机制大语言模型本质上是"下一个词预测器"。它们通过分析海量训练数据，学习词语之间的统计关系。当生成文本时，模型会根据前文计算每个可能出现的下一个词的概率，然后选择概率最高的词（或按概率分布随机选择）。这种机制导致AI文本在以下方面具有可检测特征：词汇多样性受限：模型倾向于使用训练数据中高频出现的词汇组合 ...

大语言模型

大语言模型

天数智芯涨超20%刷新上市新高通用GPU市场具备广阔发展前景

Zhi Tong Cai Jing· 2026-02-26 06:37

公开资料显示，天数智芯提供针对不同行业的通用GPU产品及AI算力解决方案。公司的产品组合主要包括通用GPU芯片及加速卡，以及定制AI算力解决方案(包括通用GPU服务器及集群)，天数智芯通用 GPU产品涵盖天垓及智铠系列，兼容国内外主流AI生态以及各类深度学习框架。今年1月，该公司公布四代芯片架构路线图，预期于2027年超越英伟达Rubin架构；同时推出"彤央"系列边端算力产品。消息面上，近年来，AI的发展，尤其是大语言模型的兴起，推动算力需求大幅增长。根据弗若斯特沙利文的资料，中国通用GPU市场快速扩张，2024年的出货量达到1.6百万片，2022年至2024年的复合年增长率为72.8%。预计市场将维持强劲增长，于2025年至2029年，出货量预计以33.0%的复合年增长率增长。随着中国通用GPU公司出货量的增长速度超越国际竞争对手，国内市场占有率持续攀升。天数智芯(09903)涨超20%，高见287港元刷新上市新高。截至发稿，涨19.52%，报285港元，成交额3.7 亿港元。 ...

ILUVATAR COREX(HK:09903)

大语言模型

通用GPU芯片及加速卡

定制AI算力解决方案

大语言模型

通用GPU芯片及加速卡

定制AI算力解决方案

计算机行业周报：LLaDA2.1实现技术突破，Gemini3.1Pro树立多模态新标准-20260225

Huaxin Securities· 2026-02-25 10:25

2026 年 02 月 25 日 LLaDA2.1 实现技术突破，Gemini3.1Pro 树立多模态新标准推荐(维持) 投资要点分析师：任春阳 S1050521110006 rency@cfsc.com.cn 行业相对表现表现 1M 3M 12M 计算机(申万) -5.4 5.5 3.4 沪深 300 0.7 5.5 20.6 市场表现 -30 -20 -10 0 10 20 30 (%) 计算机沪深300 资料来源：Wind，华鑫证券研究相关研究 1、《计算机行业周报：字节跳动 Seedance2.0 重磅上线， ClaudeOpus4.6 发布》2026-02-10 2、《计算机行业点评报告：亚马逊（AMZN.O）：AI 基础设施与零售网络共振，资本开支周期驱动长期增长》2026-02-08 3、《计算机行业点评报告：苹果（AAPL.O）：营收利润双增长， iPhone 与服务业务表现亮眼创历史新高》2026-02-05 ▌ 算力：算力租赁价格平稳，扩散语言模型 LLaDA2.1 实现技术突破 2026 年 2 月，LLaDA2.1 扩散语言模型正式发布，含 160 亿、 ...

大语言模型

ClaudeCodeSecurity

大语言模型

ClaudeCodeSecurity