Workflow
Seek .(SKLTY)
icon
Search documents
DeepSeek连发两篇论文背后,原来藏着一场学术接力
3 6 Ke· 2026-01-16 01:28
第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来 比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。 2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。 最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。 于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 —— mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等 多项工作。 如果把这些工作之间的关系搞清楚,相信我们不仅可以加深对 DeepSeek 论文的理解,还能看清大模型架构创新正在往哪些方向突破。 在这篇文章中,我们结合自己的观察和学界专家的点评, ...
付鹏:现在大家用的ChatGPT、千问、DeepSeek等,都不是未来真正重要的东西
Xin Lang Cai Jing· 2026-01-15 12:11
专题:2025微博财经之夜暨北京财经大V联盟年会 2025微博财经之夜暨北京财经大V联盟年会于1月15日在北京举行。前东北证券首席经济学家付鹏出席 并演讲。 付鹏在演讲中提到了2015、2016年的两个历史事件:第一,当年埃隆·马斯克的SpaceX失败,他含泪的 画面,是对人类文明勇于挑战、颠覆的纪念;第二,投资圈大家熟悉的木头姐,2015年她那张经典 PPT,把人类文明未来所有技术路径都列在上面,告诉大家这就是未来,让大家把钱给她,她来投资。 "大家称她为女版巴菲特,我一直跟很多人说她不是,她和巴菲特完全不同,她更像二级市场里的一级 市场投资人。"付鹏说。 他认为,作为产业、技术,早期投资所谓泡沫并非坏事,需要这样冒风险的资本。人类历史往前翻一百 多年,扬帆远航需要资本支持,可能是国王、贵族支持,需要有愿意冒风险、钱、船、人都回不来的人 去挑战、支持。所以,整个产业生命周期必然经历早期一级市场投资、估值泡沫、估值杀泡沫阶段。 付鹏进一步指出,生产关系本身还需做很多事,比如以人为本,对居民部门加大福利、补偿等。只有这 样,才能保证世界秩序不再次大规模崩塌。所以要聚焦于生产力前行,同时也要聚焦改变各国内部生产 ...
春节AI王炸突袭!DeepSeekV4硬刚海外巨头,暗藏关键破局点
Sou Hu Cai Jing· 2026-01-15 08:03
哈喽大家好,今天老张带大家聊聊春节前的AI圈居然藏着这么大一个"王炸"!中国初创公司DeepSeek直 接扔出重磅消息,新一代大模型V4预计2026年2月中旬农历新年前后上线,瞄准春节档,这是要在年味 里掀起技术狂欢的节奏啊! 预热即封神 说起来,DeepSeek这两年的发展简直像开了挂。2024年12月26日推出基础模型V3,随后在2025年1月20 日上线开源推理模型R1,凭着"先思考、再作答"的显式推理能力,既能稳妥处理复杂问题,又实现了 成本克制,直接让硅谷和华尔街都刮目相看。 之后他们推出的R1+V3聊天产品,在国内也收获了极高关注度,如今DeepSeek已然成长为中国AI工程 能力领域的标杆企业之一。 这次V4敢选春节档再战,显然是有备而来。内部测试显示,新模型的编程能力大幅提升,在 Design2Code等权威编程基准测试中以92.0分刷新纪录,可将手绘草图直接转化为可运行的React代码, 多项关键指标超越GPT-4.5、Claude3.7等海外头部厂商产品。 更核心的突破是解决了超长上下文处理难题,搭载NSA机制实现64K上下文窗口下6-9倍提速,可一次 性处理百万级Token,完美适配复杂 ...
DeepSeek一周年,中美AI之路再对比
Xin Lang Cai Jing· 2026-01-15 06:02
本报记者 杨沙沙 编者的话:路透社近日报道称,中国人工智能(AI)初创公司深度求索(DeepSeek)预计将于2月中旬 推出其下一代人工智能模型V4,该模型具有强大的编码能力,表现可能优于美国人工智能公司 Anthropic旗下大模型Claude和美国初创公司OpenAI的GPT系列等竞争对手。一年前,DeepSeek发布大 模型R1,英国广播公司(BBC)形容"DeepSeek向世界展示了中国人工智能领域的竞争力",当时距离 OpenAI推出ChatGPT也已两年。多名接受《环球时报》记者采访的专家、学者表示,2025年一年时间, 中国缩小了与美国在人工智能领域的差距,将一岁的DeepSeek和三岁的ChatGPT作为"时代的切片",能 清晰看到中美站在不同的航道。 "中美大模型跑出两条主航道" 一年前,日本企业(中国)研究院执行院长陈言忽然发现,自己在中关村融科资讯中心办公大楼的"邻 居"——中国人工智能(AI)初创公司DeepSeek火了。电梯经过DeepSeek所在的楼层不再停靠,媒体记 者守在楼下等待采访,紧接着陈言收到大量日本企业想投资这家企业的请求。但陈言告诉《环球时报》 记者:"这些日本企业已 ...
摩根资产管理:中国科技领域将迎来“更多DeepSeek时刻”,中国科技股将继续受益于技术突破
Ge Long Hui· 2026-01-15 02:14
年初至今,一项衡量中国内地科技股的指数已上涨12%,表现跑赢香港以及美国的同类指数,因投 资者纷纷涌入。从芯片到人形机器人再到商用火箭等领域的每日进展,以及大量计划中的股票上市,共 同推动了这股热潮。 展望未来,Rasid认为人工智能支出和更有利的政策将成为推动中国科技股的关键催化剂。 "我们确实认为中国在科技领域仍然有很多机会。"该公司的全球市场策略师Raisah Rasid在新加坡 的一次简报会上表示:"你们将会看到越来越多机器人技术的进步,以及更多DeepSeek时刻。" 摩根资产管理表示,随着中国加大力度创建更多类似DeepSeek的公司,中国科技股将继续受益于 技术突破。 ...
AI-医疗-DeepSeek新一代大模型电话会
2026-01-15 01:06
AI+医疗——DeepSeek 新一代大模型电话会 20260114 摘要 AI 在医疗领域应用日益广泛,尤其在影像识别、临床决策支持系统 (CDSS)和智能分诊方面。瑞金医院与华为合作开源的大模型显著提 升病理识别能力,已在多家医院推广,缓解病理科医生短缺问题。 医院 AI 系统主要由外部服务商提供,医院负责提供算力硬件设备,如海 光 CPU 和华为 910B 一体机。软件方面,"为您健康"等公司市场占有 率较高,其 VMAX GPT 后台对接 Deepseek,提供智能治疗方案。 医疗信息化支出虽有所缩减,但通过集约化管理可实现投资缩减和应用 扩张。AI 在医疗 IT 支出中占比约 1%,主要用于人工智能解决方案,区 域统一招标提高整体效率。 海外及国内个人健康应用如 OpenAI Health、蚂蚁阿福发展迅速,通过 APP 管理患者数据,结合医生和营养师指导。院内 CDSS 与 ToC 端产品 结合将带来巨大突破。 未来可能从慢性病入手进行院内外数据整合,第三方平台合作将促进数 据共享和利用。医院数据管理工作正在推进,市卫健委主导试点项目, 整理数据资产并尝试交易。 Q&A AI 在医疗领域的应用情况 ...
财经观察:DeepSeek一周年,中美AI之路再对比
Huan Qiu Shi Bao· 2026-01-14 22:51
【环球时报报道 记者 杨沙沙】编者的话:路透社近日报道称,中国人工智能(AI)初创公司深度求索 (DeepSeek)预计将于2月中旬推出其下一代人工智能模型V4,该模型具有强大的编码能力,表现可能 优于美国人工智能公司Anthropic旗下大模型Claude和美国初创公司OpenAI的GPT系列等竞争对手。一年 前,DeepSeek发布大模型R1,英国广播公司(BBC)形容"DeepSeek向世界展示了中国人工智能领域的 竞争力",当时距离OpenAI推出ChatGPT也已两年。多名接受《环球时报》记者采访的专家、学者表 示,2025年一年时间,中国缩小了与美国在人工智能领域的差距,将一岁的DeepSeek和三岁的ChatGPT 作为"时代的切片",能清晰看到中美站在不同的航道。 " 中美大模型跑出两条主航道 " 一年前,日本企业(中国)研究院执行院长陈言忽然发现,自己在中关村融科资讯中心办公大楼的"邻 居"——中国人工智能(AI)初创公司DeepSeek火了。电梯经过DeepSeek所在的楼层不再停靠,媒体记 者守在楼下等待采访,紧接着陈言收到大量日本企业想投资这家企业的请求。但陈言告诉《环球时报》 记者: ...
摩根资产管理认为中国科技领域将迎来“更多DeepSeek时刻”
Xin Lang Cai Jing· 2026-01-14 07:58
摩根资产管理表示,随着中国加大力度创建更多类似DeepSeek的公司,中国科技股将继续受益于技术 突破。"我们确实认为中国在科技领域仍然有很多机会。"该公司的全球市场策略师Raisah Rasid在新加 坡的一次简报会上表示:"你们将会看到越来越多机器人技术的进步,以及更多DeepSeek时刻。" ...
PriceSeek提醒:雅化锂矿运回促氢氧化锂供应增
Xin Lang Cai Jing· 2026-01-14 04:09
生意社01月14日讯雅化集团13日表示:公司津巴布韦锂矿已批量运回国内并用于生产。 生意社01月14日讯雅化集团13日表示:公司津巴布韦锂矿已批量运回国内并用于生产。 PriceSeek评析 氢氧化锂,多空评分:-1 雅化集团从津巴布韦批量运回锂矿用于生产氢氧化锂,表明原料供应稳定且增加,可能提升氢氧化锂产 量,导致市场供应预期增强。这将对氢氧化锂现货价格构成下行压力,因供应增加可能缓解短缺局面, 抑制价格上涨动力。评分为一般利空(-1),因事件虽未达极端程度,但实质性供应增量对价格有负面影 响。 【大宗商品公式定价原理】生意社基准价是基于价格大数据与生意社价格模型产生的交易指导价,又称 生意社价格。可用于确定以下两种需求的交易结算价: 1、指定日期的结算价 2、指定周期的平均结算价 定价公式:结算价=生意社基准价×K+C K:调整系数,包括账期成本等因素。 C:升贴水,包括物流成本、品牌价差、区域价差等因素。 PriceSeek评析 氢氧化锂,多空评分:-1 雅化集团从津巴布韦批量运回锂矿用于生产氢氧化锂,表明原料供应稳定且增加,可能提升氢氧化锂产 量,导致市场供应预期增强。这将对氢氧化锂现货价格构成下行压 ...
幻方量化去年收益率56.6%,为DeepSeek提供超级弹药
Core Insights - The article highlights the impressive performance of Huansheng Quantitative, which achieved an average return of 56.55% in 2025, ranking second among quantitative private equity firms in China, only behind Lingjun Investment with 73.51% [2] - Huansheng Quantitative's management scale has exceeded 70 billion yuan, and its average returns over the past three years and five years are 85.15% and 114.35%, respectively [2] - The strong returns from Huansheng Quantitative provide substantial funding support for DeepSeek, a company focused on AI model development, founded by Liang Wenfeng [2][4] Company Overview - Huansheng Quantitative was established in 2015 and specializes in AI quantitative trading, consistently investing in AI algorithm research [2][4] - The company has a diverse team composed of experts in various fields, including mathematics, physics, and computer science, which enables it to tackle challenges in deep learning and big data modeling [2] - The company has experienced rapid growth, surpassing 100 billion yuan in management scale in 2019 and reaching over 700 billion yuan currently [2][4] Financial Performance - Based on industry estimates, Huansheng Quantitative's strong performance last year could generate over 700 million USD in revenue, assuming a 1% management fee and a 20% performance fee [6] - The funding for DeepSeek's research comes from Huansheng Quantitative's R&D budget, with Liang Wenfeng holding a majority stake in both companies [4][5] AI Model Development - DeepSeek, incubated by Huansheng Quantitative, aims to advance general artificial intelligence and has a budget of 5.57 million USD for its V3 model training costs [7] - DeepSeek plans to release its next-generation AI model, DeepSeek V4, around the Lunar New Year, which is expected to surpass existing top models in programming capabilities [7]