Workflow
DeepSeek R1模型
icon
Search documents
北极光创投林路:AI竞争从“技术领先”转向“产品体验”
Tai Mei Ti A P P· 2025-07-03 09:52
北极光创投合伙人:林路 核心观点: 1、技术发展并非一直呈指数级增长,在初期快速突破后会趋缓。 2、基础模型差距缩小,行业竞争的焦点就会从"技术领先"转向"产品体验",而这正是创业公司大展身 手的窗口期。 3、一个产品未能构建足够强的数据壁垒或用户体验护城河,它就极易被基础模型整合、甚至直接取 代。 4、AI并不会改变人类的根本需求,但它有能力重塑服务的实现方式,甚至重构服务逻辑的能力,带来 更丰富的互动形式和更强的系统延展性。 本文内容源于北极光创投近期的一次闭门会议。林路先生(北极光创投合伙人)分享了他对 当前AI的看法洞见。林路先生于2012年加入北极光,已在传统互联网与移动互联网领域深 耕14年,积累了丰富的经验。他参与投资及投后管理的项目众多,包括元保(YB)、 XSKY、VIPKID、火花思维、棕榈大道、观脉科技等。 在讨论人工智能之前,我们有必要先理解两条至关重要的曲线。 长期以来,许多人受到互联网时代"指数级增长"神话的影响,误以为技术演进必然是持续加速的,就如 左图中那条虚线所示。 同时,随着 DeepSeek 的开源策略,以及阿里"千问"等国产模型的陆续上线,基础模型之间的差距进一 步缩小 ...
专家访谈汇总:DeepSeek二代模型因芯片短缺遭遇开发困境
■ H20在中国AI公司中非常受欢迎,尤其是与英伟达的CUDA软件堆栈的兼容性使其成为中国市场的 首选硬件。 ■ DeepSeek的CEO梁文锋表示,尽管团队在加紧工作,但尚未对性能感到满意,且在模型获得批准 部署前,仍会进行内部调整和优化。 ■ 美国的出口限制凸显了中国顶尖AI公司对美国硬件的依赖,虽然DeepSeek声称其资源投入远小于 OpenAI等美国公司,但这一依赖关系依然是一个关键弱点。 ■ OpenAI私下指责DeepSeek在R1的开发过程中使用了其专有技术,但DeepSeek尚未公开回应这些 指控。 4、 《 黄金 行业新规倒逼中小企业转型升级 》 摘 要 ■ 近日,工业和信息化部等九部门发布了《黄金产业高质量发展实施方案(2025—2027年)》的通 知,明确提出推动我国黄金产业高质量发展的具体任务与目标,标志着黄金产业进入了新的发展阶 段。 ■ 加强黄金储备有助于国家经济稳定,尤其在全球经济不确定性加剧的背景下,黄金可以有效对冲货 币贬值风险,并增强国家金融安全。 ■ 中小企业面临环保标准和技术门槛的提高,将加速行业整合,规模小、技术薄弱和环保不达标的企 业可能面临淘汰风险。 ■ 虽然短 ...
MiniMax追着DeepSeek打
Jing Ji Guan Cha Wang· 2025-06-18 11:32
2025年2月,DeepSeek火爆出圈,除了免费和好用之外,还因其仅以500万至600万美元的GPU成本,就 训练出了与OpenAI o1能力不相上下的DeepSeek R1模型,引起行业震撼,不过这一成本数据也引发了广 泛争议。 MiniMax称,M1模型的整个强化学习阶段仅使用了512块英伟达H800 GPU,耗时三周,成本仅为53.5万 美元,这一成本"比最初的预期少了一个数量级"。 MiniMax解释,MiniMax M1的强文本处理能力和更低成本,背后是两大核心技术作为支撑,一是线性 注意力机制(Lightning Attention)混合构架和强化学习算法CISPO。例如,CISPO算法通过裁剪重要性 采样权重,而非传统算法中调整Token的更新方式,来提升强化学习的效率和稳定性。 经济观察报 记者 陈月芹 6月17日,MiniMax(稀宇科技)宣布其自主研发的MiniMax M1模型开源,并计划在未来5天内每天发 布一项新产品或新技术。而这款MiniMax M1模型,在关键技术规格、架构设计、上下文处理能力、训 练成本等维度全面对标DeepSeek R1,甚至是谷歌Gemini 2.5 Pro ...
一文了解DeepSeek和OpenAI:企业家为什么需要认知型创新?
混沌学园· 2025-06-10 11:07
在这个 AI技术日新月异的时代,我们眼看着它不仅在改变生活,更在 改变着 商业规则。 AI可不只是那些冰冷的算法,它现在能像人一样思考、推理,甚至在某些方面 的表现超越了普通人 。这告诉我们,传统的技术和创新模式已经不够用了, 企业要想增长、要保持竞争力,就 需要 换个思路。 AI正在重新定义我们理解和实践商业创新的方式。 最近 , 混沌君旁听了 混沌学园的创始人李善友教授 的重磅 全新课程《认知型创新:从 OpenAI到DeepSeek》 。 这门课从企业创新的角度, 讲述了 全球两大顶尖 AI公司——OpenAI和DeepSeek是如何一步步走到今天的,他们究竟走过了怎样的创新之路。这对于我 们理解AI时代的技术创新和企业创新,提供了清晰且极具价值的路径。 教授 深挖 了 OpenAI最初的愿景和它如何对抗巨头的思路,解密大语言模型是如何诞生的 , 尤其是 AI能力如何从简单积累到惊人"涌现" 。 还 解读 了 DeepSeek如何在资源有限的情况下,走出一条"低成本高性能"的独特道路;更探讨 了 AI时代下,企业应该怎样构建一个能不断"涌现"创新的组织模式, 走向"技术领先"。 扫描下图二维码购买月卡 ...
创业板人工智能ETF(159388)涨近2.5%,AI推理能力提升或加速场景渗透
Mei Ri Jing Ji Xin Wen· 2025-06-09 05:36
消息面上,6月7日,2025全球人工智能技术大会(GAITC2025)在杭州开幕,聚焦"交叉、融合、相 生、共赢"主题,汇聚全球200多位专家学者,并启动人工智能领域知识产权证券化融资专项支持行动, 计划三年内发行5支相关产品,辐射60余家企业。 西部证券指出,AI产业趋势向上,推理能力提升驱动复杂场景渗透。2025年5月,计算机行业指数表现 弱于沪深300指数,但海外科技巨头如微软、英伟达、谷歌等涨幅显著。AI领域持续进阶,Claude 4系 列发布,编程能力进一步提升,其中Claude Opus 4在编码任务中表现领先,能够长时间运行复杂任务; DeepSeek R1模型升级后,复杂推理能力显著增强,准确率大幅提升。谷歌在I/O 2025上展示了AI大模 型及产品的全面升级,包括Gemini系列的功能扩展和新模型发布。AI Agent及算力仍是最明确的投资方 向,产业趋势向好,推理能力的提升将推动AI在更多复杂场景中的应用。 注:指数/基金短期涨跌幅及历史表现仅供分析参考,不预示未来表现。市场观点随市场环境变化而变 动,不构成任何投资建议或承诺。文中提及指数仅供参考,不构成任何投资建议,也不构成对基金业绩 ...
“六小龙”火热出圈后 杭州欲打造超3900亿人工智能核心产业
在日前由中国记协主办的全国新闻界采编骨干增强"四力"教育实践浙江行活动现场,《中国经营报》记者注意到,作为2025年火热出圈的杭 州"六小龙"之一,宇树科技的明星产品备受参观者追捧。 5月29日,宇树科技更名为"杭州宇树科技股份有限公司",引发外界关于其或将上市的猜想。宇树科技则对外表示:"这是公司运营方面的常规变 更。"加速发展的宇树科技无疑是杭州人工智能产业发展的缩影,6月4日,杭州召开全市人工智能创新高地建设动员会,提出一系列新目标, 如"力争人工智能核心产业营业收入超过3900亿元,规模以上核心产业企业超700家"。 "'六小龙'崛起,无疑给杭州市打造'全国数字经济第一城'增加了厚重的砝码。未来,软硬结合的人工智能产品,包括机器人将成为杭州市新的城 市特色产品,并由此带动浙江经济系统性更新。"浙江工商大学区域经济研究所所长倪树高此前向记者表示。 营收力争超3900亿元 自蛇年春节开始的杭州"六小龙"热潮,迄今仍在延续。 今年5月25日,全球首个以人形机器人为参赛主体的格斗竞技赛事在杭州拉开帷幕,而宇树G1人形机器人作为唯一参赛机型亮相,会进行各种高 难度动作、进行精彩格斗比赛的人形机器人,迅速引发市场 ...
外媒:阿里大模型全线切换,放弃DeepSeekR1
是说芯语· 2025-06-04 05:20
据The Information报道,知情人士透露,阿里巴巴旗下各业务单元已启动基于Qwen3模型的智能 体开发计划。 加入"中国IC独角兽联盟",请点击进入 投稿 、 商务合作 请微信 dolphinjetta 是说芯语,欢迎关注分享 市场分析显示,Qwen系列模型正在双向发力:对内成为统一阿里系AI能力的技术基座,对外则 通过开源策略加速中国产业AI化进程。与此同时,阿里云正推动Qwen模型的全球化布局,与欧 美主流开源模型展开竞争。 这标志着阿里AI战略的重大转折。2023年首代Qwen发布时,其性能甚至未能说服部分内部团队 ——直到2024年初,仍有业务线坚持使用Meta的Llama等第三方模型。而Qwen3的突破性进 展,使得阿里首次实现技术自主与商业落地的协同效应。 更具象征意义的是,已退隐六年的马云在Qwen3研发期间持续关注进展。这位创始人通过定期听 取专项汇报的方式,向团队传递出"只许成功"的战略决心。观察人士指出,这种非常规介入既凸 显Qwen3对阿里未来的关键价值,也折射出企业在AI竞赛中的紧迫感。 阿里巴巴集团凭借最新开源的Qwen3大模型,正在人工智能领域快速构建技术领导力。这一突破 ...
“复刻”幻方量化打造Deepseek 量化私募基金念空在大模型底层技术研发取得突破
经济观察报· 2025-06-03 11:17
随着AI大模型迭代升级,如今量化私募基金对AI大模型底层技 术的研发布局,日益侧重算法优化。在这个过程,产学研的结 合将是他们在大模型底层技术研发方面取得突破的"捷径"。 作者:陈植 封图:图虫创意 5月以来,全球大模型研发公司在大模型语义理解、多模态等方面的"较劲"悄然升级。 中国深度求索(DeepSeek)公司表示,DeepSeek R1模型已完成小版本升级,令大模型的思维深 度与推理能力显著提升。 国内量化私募基金念空科技与上海交通大学计算机学院开展合作,提出一种全新的大模型训练框架 (SASR),并发表论文投向全球顶级人工智能会议期刊NIPS。 念空科技创始人王啸在6月3日接受本报记者专访时表示,这项全新的大模型训练框架(SASR), 在GSM8K任务中,在仅使用1.5B模型的情况下,准确率就超过了80%,接近GPT-4o的表现;而在 KK逻辑推理任务中,其准确率比GPT-4o还高出约9个百分点。SASR让通用大模型变得更"聪明"。 他告诉记者,当前大模型技术的训练框架,主要围绕监督微调(SFT)和强化学习(RL),所谓监督微 调(SFT)就是不断给大模型输入资料和案例进行监督训练,相当于"刷题"; ...
“复刻”幻方量化打造Deepseek 量化私募基金念空在大模型底层技术研发取得突破
Jing Ji Guan Cha Wang· 2025-06-03 06:57
Core Insights - The competition among global large model development companies has intensified, particularly in semantic understanding and multimodal capabilities since May [2] - Domestic quantitative private equity funds are also entering the race, achieving breakthroughs in AI large model foundational technology [2][5] - A new training framework (SASR) proposed by NianKong Technology in collaboration with Shanghai Jiao Tong University has shown promising results, achieving over 80% accuracy on the GSM8K task with a 1.5B model, nearing GPT-4o's performance [2][4] Group 1: Training Framework and Algorithm Optimization - The current training frameworks for large models primarily focus on Supervised Fine-Tuning (SFT) and Reinforcement Learning (RL), with the challenge being to optimize the balance between these two methods [3][8] - The new training framework aims to dynamically adjust the relationship between SFT and RL, allowing the model to become "smarter" without increasing data volume [3][9] - The innovative training framework has been applied in quantitative investment strategy development, achieving approximately 80% market prediction accuracy compared to traditional models [4][13] Group 2: Industry Trends and Collaborations - Many quantitative private equity firms are establishing AI Labs to focus on foundational technology research for large models, emphasizing algorithm optimization [6][11] - The integration of academic research and private equity expertise is seen as a shortcut to breakthroughs in large model foundational technology [5][11] - The emergence of smarter large models with lower parameter counts but superior overall capabilities is attributed to innovations in training frameworks and algorithm optimization [10] Group 3: Future Directions and Challenges - The ability of large models to become "smarter" in various vertical fields depends on high-quality data and effective training modes [12] - NianKong Technology aims to empower large models to excel in more vertical fields, enhancing China's competitiveness in the global AI landscape [14]
新一轮“东升西落”交易起点!科创板人工智能ETF(588930)现涨1.17%,连续2个交易日获得资金净流入
Mei Ri Jing Ji Xin Wen· 2025-06-03 03:08
开源证券表示,DeepSeek最新发布的R1模型在数学、编程与通用逻辑等多个基准测评中取得国内领先 的成绩,整体表现接近国际顶尖模型,如o3与Gemini-2.5-Pro。这一进展表明,国产大模型的技术能力 正快速追赶国际水平,为后续在更多领域的商业化应用打下坚实基础。新版DeepSeek R1在减少"幻 觉"问题方面取得显著成效,幻觉率下降约45~50%,在文本改写、摘要生成、阅读理解等场景中表现 更加稳定可靠。同时,模型在议论文、小说、散文等文体上的优化,使其能够生成更长、结构更完整的 文本内容,拓展了AI在内容创作方面的潜力。 相关产品:科创板人工智能ETF(588930) (文章来源:每日经济新闻) 消息面上,6月美元跌破前低后,新一轮"东升西落"交易将开启。从历史经验看,在全球流动性宽松、 美元下行阶段,非美资产往往走强,中国市场也将受益。基于特朗普政策持续扰动、美国政府的债务压 力以及基本面潜在风险等多重因素压制,美元将趋势性走弱。美元指数自5月中旬再度转跌以来,已经 再度回落到100点下方,弱美元驱动的流动性外溢将带动A股开启新一轮"东升西落"交易。进入6月,科 技板块将迎来密集的事件催化,景气 ...