开源模型
Search documents
腾讯混元开源翻译模型1.5
Mei Ri Jing Ji Xin Wen· 2025-12-30 08:44
(文章来源:每日经济新闻) 每经AI快讯,12月30日,腾讯混元公众号消息,腾讯混元正式开源翻译模型1.5版本,共包含两个模 型:Tencent-HY-MT1.5-1.8B和Tencent-HY-MT1.5-7B,支持33个语种互译以及5种民汉/方言,除了中 文、英语、日语等常见语种,也包含捷克语、马拉地语、爱沙尼亚语、冰岛语等小语种。目前两个模型 均已在腾讯混元官网上线,在开源社区也可直接下载使用。 ...
腾讯混元开源翻译模型1.5 端侧可部署
Di Yi Cai Jing· 2025-12-30 08:27
(文章来源:第一财经) 腾讯混元宣布推出并开源翻译模型1.5,共包含两个模型:Tencent-HY-MT1.5-1.8B和Tencent-HY-MT1.5- 7B,两个模型均支持33个语种互译以及5种民汉/方言,除了中文、英语、日语等常见语种,也包含捷克 语、马拉地语、爱沙尼亚语、冰岛语等小语种。模型已在腾讯混元官网上线,通过开源社区也可以直接 下载使用。 ...
英伟达成美国大模型开源标杆:Nemotron 3连训练配方都公开,10万亿token数据全放出
量子位· 2025-12-26 06:35
而且开放得很彻底: 不仅开放模型权重,还要把超过10万亿token的训练数据、预训练和后训练软件、训练配方全部公开。 梦晨 发自 凹非寺 量子位 | 公众号 QbitAI 英伟达在开源模型上玩的很激进: "最高效的开放模型家族"Nemotron 3,混合Mamba-Transformer MoE架构、NVFP4低精度训练全用上。 与其他开源模型相比性能有竞争力,且速度快1.5-3.3倍。 把Mamba和Transformer混着用 Nemotron 3在架构层面追求推理效率的最大化。 传统Transformer的自注意力机制需要对不断增长的KV Cache做线性扫描,序列越长,计算开销越大。 英伟达的解决方案是大量使用Mamba-2层替代自注意力层——Mamba层在生成时只需要存储固定大小的状态,不受序列长度影响。 以Nano型号为例,整个模型主要由交替堆叠的Mamba-2层和MoE层构成,自注意力层只保留了少数几个。 论文给出的层排布模式是:5个Mamba-2+MoE的重复单元,接3个同样结构的单元,再来1个包含注意力层的单元,最后是4个Mamba- 2+MoE单元。 在8k输入、16k输出的典型推理场景下 ...
8点1氪:官方回应吸毒记录封存相关问题;强生爽身粉致癌案判赔女子约110亿元;俞敏洪敲定东方甄选接班人
36氪· 2025-12-25 00:26
Group 1 - The revised Public Security Administration Punishment Law will take effect on January 1, 2026, and has garnered significant attention from media and the public regarding Article 136 [4][5] - The law's revision process included public consultations during its initial and second readings in August 2023 and June 2024, respectively, with specific provisions for sealing records of minor offenders [5][6] Group 2 - The law's provisions for sealing public security violation records apply to minors, covering various types of violations [5] - The law aims to address public concerns and clarify the implications of sealing records for individuals involved in minor offenses [4][5] Group 3 - The law's revisions reflect a broader trend in legal reforms aimed at balancing public safety with the rehabilitation of young offenders [5][6] - The law's implementation is expected to influence public perception and legal practices surrounding juvenile offenses in China [4][5]
8点1氪|官方回应吸毒记录封存相关问题;强生爽身粉致癌案判赔女子约110亿元;俞敏洪敲定东方甄选接班人
3 6 Ke· 2025-12-24 23:57
Group 1 - The revised Public Security Administration Punishment Law will take effect on January 1, 2026, with a focus on sealing records of minor offenses, particularly for minors [2][3] - The law aims to prevent the lifelong consequences of a single punishment, providing a framework for sealing minor offense records, which will still be recorded but not publicly accessible [4][5] - The law clarifies the relationship between the Public Security Administration Punishment Law and the Criminal Law, stating that criminal acts must be prosecuted under criminal law, while non-criminal acts are subject to administrative penalties [6][7] Group 2 - The sealing of drug-related records is included in the law, emphasizing that drug use is treated as a violation rather than a crime, with a strong focus on rehabilitation and prevention of drug abuse [8][9] - The government has established a comprehensive system for drug rehabilitation, including voluntary and mandatory rehabilitation measures, and emphasizes the importance of confidentiality regarding the personal information of drug users [9][10] Group 3 - The law has received no objections since its announcement on June 27, 2025, indicating broad acceptance and support from the public [3][4] - The law's provisions are designed to ensure that all citizens are treated equally under the law, reinforcing the principle of equality before the law [2][5]
中国大模型公司,开始扎堆上市
Sou Hu Cai Jing· 2025-12-23 04:45
两家公司虽同属大模型赛道,但成长路径与产品方向存在明显分野。 智谱源自清华大学计算机系的技术成果转化,由该系知识工程实验室的团队创立。公司专注于AGI的研发,其基于自回归填空的全国产预训练架构GLM系 列模型已适配40余款国产芯片,被业内视为通用性最高的模型之一。 两种路径 作为"大模型六小虎"中首家启动IPO流程的公司,智谱最早在2025年4月即在北京证监局办理辅导备案。而MiniMax的上市进程同样备受关注,据信其目标 是在2026年1月登陆资本市场。 12月17日,智谱通过港交所上市聆讯,并于12月19日正式披露招股书。紧随其后,MiniMax也完成了相同程序,其招股书于12月21日首次刊发。 当两只AI独角兽几乎同时通过港交所上市聆讯,一场关于"全球大模型第一股"的资本盛宴,正式拉开帷幕。 智谱构建了全面的产品矩阵,覆盖从边缘小模型到百亿参数旗舰大模型的不同规模。其产品功能涵盖对话、通用智能体、代码生成、图像理解、文生图/ 视频及语音交互等多个场景。 在冲刺IPO之前,两家公司已在资本市场上获得了充分的弹药储备。 智谱自2019年成立以来,已完成多轮融资。投资者中既有高瓴资本、启明创投、君联资本等知名 ...
智谱GLM-4.7上线并开源
Di Yi Cai Jing· 2025-12-23 01:25
(文章来源:第一财经) 智谱宣布GLM-4.7上线并开源。新版本面向Coding场景强化了编码能力、长程任务规划与工具协同,并 在多项主流公开基准测试中取得开源模型中的领先表现。目前,GLM-4.7已通过BigModel.cn提供API, 并在z.ai全栈开发模式中上线Skills模块,支持多模态任务的统一规划与协作。 ...
智谱宣布开源新一代旗舰模型GLM-4.7
Xin Lang Cai Jing· 2025-12-23 00:32
Core Viewpoint - The release of GLM-4.7 by Zhiyu marks a significant advancement in open-source AI models, achieving top performance in various benchmark tests and surpassing GPT-5.2 in a global coding evaluation system [1][1]. Performance Highlights - GLM-4.7 achieved the best performance among open-source models in multiple mainstream benchmark tests [1]. - In the Code Arena, a prestigious coding evaluation system with participation from millions of users, GLM-4.7 ranked first among open-source models and first among domestic models, outperforming GPT-5.2 [1][1]. Feature Enhancements - The model has enhanced coding capabilities, long-range task planning, and tool collaboration, specifically targeting coding scenarios [1]. - Improvements have also been made in areas such as chat, writing, and role-playing, showcasing its comprehensive performance [1].
观察 | 到底谁才是国内AI大模型的真第一?
未可知人工智能研究院· 2025-12-22 04:01
▲ 戳蓝 色字关注我们! "第一并不总是最好的,最好的往往不急于争第一。"—— 乔治·卢卡斯(George Lucas) 到底谁才是国内AI大模型的第一名? 智谱的招股书里说科大讯飞是第一,占比9点多; IDC的报告说字节的豆包拿了半壁江山,49%的市场份额; 然后硅谷顶级风投A16Z和OpenRouter又发了份报告说DeepSeek才是全球第一。 三份文件,都是这个月刚发布的,但却有三个第一名。这到底谁在说谎? 今天这期内容,我就把这三份报告给你掰开了揉碎了分析分析。 讲完你就明白了——而且看懂这件事,对咱们的职业选择、投资判断,甚至用哪个AI工具,都有直接的指导意义。 不同的"第一",不同的衡量标准 1. 智谱招股书:看营收,科大讯飞是"赚钱第一" 先说智谱的招股书。 2. IDC报告:看调用量,字节豆包占"半壁江山第一" 他们前两天刚递交港交所,想冲刺"全球大模型第一股"。我还专门做了一期视频分析招股书。 招股书里专门放了张表,2024年中国大模型厂商收入排名: 虽然招股书用了代号,但你稍微一推就知道,第一名基本就是科大讯飞——深圳的,做语音起家的,2024年大模型相关收入五个多亿人民币, 中标项目也 ...
金融大家评 | 中国农业银行董事长、党委书记 谷澍:提升AI应用普惠性的若干思考
清华金融评论· 2025-12-18 09:46
以下文章来源于中国金融 ,作者谷澍 《中国金融》杂志由中国人民银行主管,以"权威、专业、理性、前沿"为理念,以"高端权威、高层读者、高效传播"为特色,以宣传金融政策、分析金融运 行、报道金融实践为主旨,是国内外了解中国金融的重要载体 导语: 党的二十届四中全会审议通过的《中共中央关于制定国民经济和社会发展第十五个五年规划的建议》多次提及"人工智能",指出要 全面实施"人工智能+"行动,全方位赋能千行百业。2025年8月,国务院印发的《关于深入实施"人工智能+"行动的意见》明确要通过"三步 走",不断提升新一代智能终端、智能体等应用普及率。金融业应主动融入"人工智能+"发展进程,当好提升AI应用普惠性的践行者,推动技 术创新与业务应用深度融合。当前,人工智能技术迭代演进速度非常快,下一步往哪个方向发展、发展成什么样,难以形成统一的共识。但 普惠是人类始终应当坚持的价值取向。提升AI应用普惠性的路径, 中国农业银行董事长、党委书记谷澍 认为有四方面问题需要考虑。 1 开源模型与闭源模型 中国金融 . 开源、闭源的选择不只是技术问题,而且对技术的应用有深远影响。开源意味着技术平权和自主可控,开源模型采用分布式协同创 ...