大语言模型
Search documents
珠海金智维人工智能股份有限公司递表港交所主板
Zhi Tong Cai Jing· 2025-12-15 13:22
据港交所12月15日披露,珠海金智维人工智能股份有限公司递表港交所主板,国泰君安融资有限公司及 中银国际亚洲有限公司为其联席保荐人。招股书显示,珠海金智维人工智能股份有限公司是一家专注于 提供人工智能("AI")数字员工解决方案及企业级智能体解决方案的AI企业,通过自主研发的AI解决方 案,助力企业加速其数智化转型。通过将AI算法、大语言模型("大语言模型")和机器人流程自动化 ("RPA")技术与行业场景的深度融合,该公司实现了将各种不同的工作交由AI数字员工及智能体处理。 如以下根据弗若斯特沙利文的资料提供的各种排名所示,该公司已服务众多行业多家头部企业,并取得 市场领先地位。按市场份额计,珠海金智维人工智能股份有限公司于2022年至2024年连续三年在中国 AI数字员工解决方案市场蝉联榜首。于整个往绩记录期间,该司在此市场服务的大中型企业数量亦位 居市场首位。公司的市场领先地位尤其体现在金融服务领域,自2022年至2024年连续三年市场份额稳居 第一。 | [编纂]項下的[編纂]數目 : [編纂]股H股(視乎[編纂]行 | 使與否而定) | | --- | --- | | [編纂]數目 .. | [編纂 ...
2025年中国金融智能体发展研究报告
艾瑞咨询· 2025-12-15 00:06
金融智能体行业丨研究报告 摘要: 本报告基于技术发展周期视角 , 对中国金融智能体的落地现状和趋势展开了深度洞察 ,阐述了 金融智能 体在关键周期阶段的主要表现 , 期望能够为行业提供一份拥有参考价值的研究内容。 序 - 背景 三重驱动因素推进金融智能体发展 相比近年来金融机构采纳的各类新兴技术,大模型及智能体的发展在"技术突破、业 务创新与政策支持"的多重因素驱动下,展现出更为强劲的发展势头 近年来,各类新兴技术相继涌现,均在初步探索期获得市场关注,也都经历了从概念炒作到理性回 归的过程。这些技术中,部分通过重塑业务流程实现稳健发展,部分则因未能规模落地而发展停 滞。多家金融机构技术负责人反映,尽管各类新兴技术持续影响金融科技战略布局,但很多决策者 日趋理性,会审慎对待市场炒作,从而更关注技术的实际价值。 与其他技术相比,大语言模型、金融大模型及智能体的创新展现出显著不同的特质。它们凭借技术 突破和场景应用创新,为金融业务升级开辟了新路径;加之政策层面的积极引导,共同为技术的发 展构建了坚实的支撑。这种技术、场景创新与政策的多重共振,使大模型驱动的智能体在中国市场 展现出强劲的内生动力。目前,很多金融机构也 ...
上海AI Lab胡侠:KV Cache压缩之后,可让价格2万美金的GPU发挥出20万美金的价值丨GAIR 2025
雷峰网· 2025-12-12 07:16
" 将 Key 跟 Value Cache 按照不同的方法压缩,可以让模型不掉 点。 " 作者丨张进 编辑丨 林觉民 目前,不同大模型厂商发布的大语言模型在处理超长上下文方面已经有显著突破,最高的已能支持数百万 Token 的输入,例如 MiniMax-M1、Qwen2.5-1M 系列模型,均支持百万Token(1M)级别的超长上 下文处理能力。 但是这场有关提升大模型上下文长度的"军备赛"依然不会停止,这是一项巨大的工程与效率之战。因为超 长下文为模型智能提供了最广阔的发挥空间——在处理如金融、法律、医疗等领域的长语境任务时表现更 好。所以谁能率先突破更长上下文处理能力,便有机会创造出更大的商业与技术价值。 胡侠团队便针对这一目标提出了一项最新研究方案——"通过有损计算(Lossy Computation)来提高大 语言模型的推理效率"。这项研究的基本思路是,利用大语言模型对来自低精度计算等"有损"操作产生的 噪声具有极强鲁棒性这一特点,主动引入可控的、不损害性能的信息损失,以换取显著的效率提升。 大模型中的"有损计算"是通过有选择地牺牲一部分精度来大幅降低计算或者存储成本,从而提升推理效 率,主要围绕模型 ...
分析师:GPT-5.2看起来是又一次“质的飞跃”
Ge Long Hui· 2025-12-12 03:51
Core Insights - The release of the GPT-5.2 model by OpenAI shows a significant leap in cognitive abilities, particularly in abstract reasoning and generalization, as evidenced by its performance in the ARC-AGI-2 test, which increased from 17.6% to 52.9% [1] - The GDPval score, which measures the economic value of the model, rose dramatically from 38.8% to 70.9%, indicating a simultaneous breakthrough in both scalability and reasoning capabilities [1] Performance Comparison - In the SWE-Bench test, GPT-5.2 achieved a score of 55.6%, surpassing GPT-5.1's 50.8%, while Anthropic's Claude scored 52.0% and Google's Gemini scored 43.3% [2] - For the GPQA test, GPT-5.2 scored 92.4%, compared to GPT-5.1's 88.1%, with Claude at 87.0% and Gemini at 91.9% [2] - In the CharXiv reasoning test, GPT-5.2 scored 82.1%, significantly higher than GPT-5.1's 67.0%, while Gemini scored 81.4% [2] - The FrontierMath test results showed GPT-5.2 at 40.3%, GPT-5.1 at 31.0%, and Gemini at 37.6% [2] - In advanced mathematics, GPT-5.2 scored 14.6%, while Gemini scored 18.8% [2] Abstract Reasoning Metrics - The ARC-AGI 2 score for GPT-5.2 was 52.9%, a substantial increase from GPT-5.1's 17.6%, while Claude and Gemini scored 37.6% and 31.1% respectively [3] - The GDPval score for GPT-5.2 was reported at 70.9%, a significant rise from GPT-5.1's 38.8% [3]
分析师:GPT-5.2看起来是又一次“质的飞跃”!重要指标分数从38.8%飙升至70.9%
Ge Long Hui· 2025-12-12 03:51
Core Insights - The release of the GPT-5.2 model by OpenAI shows a significant leap in cognitive abilities, particularly in abstract reasoning and generalization, as indicated by its performance in the ARC-AGI-2 test, which increased from 17.6% to 52.9% [1] - The GDPval score, which measures the economic value of the model, rose dramatically from 38.8% to 70.9%, highlighting a breakthrough in both scaling and reasoning capabilities [1] Performance Metrics - In the SWE-Bench test, GPT-5.2 achieved a score of 55.6%, outperforming GPT-5.1 at 50.8% and other models like Claude and Gemini [2] - For GPQA, GPT-5.2 scored 92.4%, surpassing competitors such as Claude at 88.1% and Gemini at 91.9% [2] - In the CharXiv reasoning test, GPT-5.2 scored 82.1%, significantly higher than Claude's 67.0% [2] - In advanced mathematics, GPT-5.2 achieved a score of 40.3% in the FrontierMath test, compared to 31.0% for Claude and 37.6% for Gemini [2] - The ARC-AGI 1 test saw GPT-5.2 scoring 86.2%, while ARC-AGI 2 showed a notable increase to 52.9% from GPT-5.1's 17.6% [2] - The GDPval score of 70.9% for GPT-5.2 indicates a substantial improvement in knowledge work tasks compared to GPT-5's 38.8% [2]
GPT-5.2性能爆表,但红色警报没有解除
3 6 Ke· 2025-12-12 01:41
虽然在时间上,GPT-5.2只跟5.1相隔了一个月。但是从公布的性能数据来看,GPT-5.2较上一代提升巨大,而且远超谷 歌和Anthropic的同期产品。 就在刚刚,ChatGPT-5.2发布了。 这是OpenAI成立以来,首次发布红色警报(Code Red)后的第一款产品。 然而OpenAI的红色警报并未因此解除,这家公司仍处于危机之中。 究其原因,现在的市场已经逐渐开始对OpenAI祛魅,而是更冷静地审视每一分算力背后的投入产出比。在这种前所未 有的环境之下,OpenAI不仅需要证明自己是最强的,还需要证明自己不可被替代。 01 首先要说的,就是GPT-5.2的数学能力。 长期以来,业界普遍认为大语言模型虽然能写代码、能聊天,但在严格的数学推理上总是差强人意。这次GPT-5.2 Thinking在AIME 2025数学竞赛中拿到了100%的满分。 | | OpenAl | | Anthropic | Google | | --- | --- | --- | --- | --- | | | GPT-5.2 | GPT-5.1 | Claude | Gemini | | | Thinking | Think ...
“横冲直撞”的AI手机来了
第一财经· 2025-12-11 04:10
Core Insights - The article discusses the impact of AI on the traditional mobile ecosystem, highlighting the competition between major tech companies and the emergence of AI-driven applications [3][4][8]. Group 1: AI and Mobile Ecosystem - ByteDance's collaboration with ZTE has prompted the industry to recognize the competition for control over mobile desktop interfaces, shifting focus from AGI and foundational model training to application deployment and entry point competition [4][8]. - The introduction of AI assistants aims to reduce user operation costs and enhance interaction efficiency, representing a significant evolution in smart terminal technology [4][8]. - The AI phone, dubbed Doubao, is seen as a potential disruptor to traditional app usage, allowing users to make requests and have AI complete tasks across multiple platforms [8][9]. Group 2: Challenges and Limitations - Users of the Doubao AI phone report that its accuracy is initially low, requiring multiple tests for optimization [7]. - The AI phone faces restrictions when accessing major applications, often requiring manual intervention for tasks involving sensitive user data [8][12]. - Concerns about privacy and security arise from granting AI systems access to core operating system functions, leading to potential risks such as data breaches and compliance issues [12][14]. Group 3: Industry Response and Future Outlook - Industry experts suggest that the mobile sector has not seen significant innovation for a long time, and the future direction should focus on openness and improved user experiences [11][18]. - There is a call for regulatory frameworks to address the conflicts arising from AI assistants disrupting existing commercial orders, emphasizing the need for both external regulations and internal industry governance [12][13]. - The future of the smart terminal ecosystem is expected to be diverse, involving various hardware and software service providers, with a need for unified standards to facilitate interoperability [18].
2023-2025年功能食品品类趋势与创新洞察变化报告-久谦中台
Sou Hu Cai Jing· 2025-12-10 19:17
行业整体呈现量价齐升态势,2023-2025年CAGR达14.2%,增长核心转向"强功效"与"科学成分",维矿、营养补充、蛋白、海洋生物四大品类贡献主要增 量,而概念模糊的传统滋补品类持续萎缩。消费者洞察方式从碎片化数据拼凑升级为大语言模型结合社媒数据的深度分析,实现从"知其然"到"知其所以 然"的跨越。 消费端发生深刻变革:人群向专业化、精细化转型,儿童、备孕女性、职场人士等细分群体需求凸显;消费心理从情感导向转向理性消费,聚焦疾病预防、 压力缓解、专注力提升等核心痛点;使用场景从广谱日常辅助转向孕期、备考等特殊场景;成分选择上,抗衰/抗氧化的高活性成分快速崛起,传统单一成 分增长停滞。竞争格局呈现K型分化,严肃剂型与零食剂型占据两端,中间产品面临淘汰,且药企与食品巨头的跨界入局加剧竞争。 液体钙作为品类重做成功典范,实现爆发式增长,2023-2025年销量CAGR达47.0%,销售额CAGR达56.2%。其成功核心在于解决传统钙片吞咽困难、吸收 不佳等痛点,通过液体剂型实现"进食感"替代"服药感",并借助独立包装突破场景限制,结合口味创新实现零食化转型。目标人群从婴幼儿向儿童、青少年 上移,家长的身高焦虑 ...
上市公司数字技术风险暴露数据(2007-2024年)
Sou Hu Cai Jing· 2025-12-10 07:57
上市公司数字技术风险暴露数 据(2007-2024年) 上市公司数字技术风险暴露数据(2007-2024年) 上市公司数字技术风险暴露数据(2007-2024年) 上市公司数字技术风险暴露数据(2007-2024年) 大语言模型是指用于处理自然语言信息的大型人工智能模型,其中,FinBERT是国内首个在金融领域大 规模语料上训练的开流模型。这类模型利用注意力机制,得出对每个词上下文敏感的表示,能够捕获文 本中的长距离依赖性和复杂关系,从而更细致地理解和生成语言。 选择企业年度报告MD&A部分的文本作为识别数字技术风险暴露程度的信息基础基于以下两方面的考 虑:第一,大量文献证实MD&A部分具有客观有效的信息含量,存在风险揭示功能,并能增强财务报 告的有用性。我们发现在MD&A中,部分企业会以独立段落重点写明企业面临的技术风险。例如,某 企业指出:"公司技术革新风险:公司互联网视频业务对互联网的依赖程度较高,运营的安全易受到电 讯故障、黑客攻击、病毒等因素的影响。"第二,基于MD&A部分信息识别企业风险暴露情况的做法在 国内外众多文献中已经得到应用。 一、上市公司数字技术风险暴露数据下载地址 1.先在百度搜索以下 ...
智能体将取代APP和SaaS,张亚勤院士发布这些AI洞见
Di Yi Cai Jing· 2025-12-10 05:56
10年以后的机器人比人还要多。 "10年以后的机器人比人还要多,未来的Saas和APP都会被智能体取代……"12月10日,清华大学智能产业研究院院长、中国工程院外籍院士张 亚勤在Meet2026智能未来大会上,一口气谈了他对于人工智能未来的多个趋势性洞见。 AI正在从信息世界走向物理世界和生物世界。他将这个过程描述为从大语言模型走向VLA(视觉-语言-动作)模型——不仅要理解文字和图 像,还要在真实世界中行动。其中无人驾驶在今年已到拐点,预计到2030年,约10%的新车将具备无人驾驶能力,那将是自动驾驶 的"DeepSeek时刻"。 机器人是张亚勤眼中"未来最大的赛道"。尽管人形机器人成熟尚需时日,但他认为十年内机器人的数量或将超过人类。但他同时也提醒,AI能 力的快速提升也伴随着风险的急剧增加。 基于对技术架构的前瞻,张亚勤展示了他绘制的演进图。在ChatGPT问世不久后他构想的架构中,基础大模型作为平台,之上支撑着各垂直领 域模型、SaaS服务层,最上层是各类应用APP。而在今年10月的更新中,他明确提出,未来的SaaS服务和终端APP都将被智能体所取代——智 能体即未来的软件与服务形态。这些智能体将涵盖 ...