scaling

Search documents
世界怎么就「东升西落」了?聊聊二级市场与 DeepSeek+Manus 的热潮 | 42章经
42章经· 2025-03-30 14:25
「东升西落」的叙事 曲凯: 最近我又来美国了,发现市场真是变化太快,这边突然有人开始提到一个所谓「东升西 落」的叙事。 莫傑麟: 对,二级市场今年 1 月以来一直在演绎这个剧本,但其实 24 年就已经在为这个叙事做 铺垫了。 24 年美国的宏观环境和各项经济数据都比较好。他们一方面非常重视 AI,在所有前沿创新上也一 直绝对领先,另一方面又凭借美元的强势吸引着全球的投资。 但今年 Trump 上台之后,情况发生了变化。 Trump 在关税、财政支出上都做了很多调整,一套大刀阔斧去杠杆的动作下来,大家关注的重点 从 AI 转向了宏观问题,也对未来多了很多不确定性。 又因为过去几年,美国股市一直走高,投资人的预期已经被拉得很满。所以大家现在极度厌恶风 险,股市就会出现剧烈的震荡。 而今年的中国刚好是美国的镜像。 其实国内的股价从 24 年开始就有回升,但并不明显,直到今年 DeepSeek 的发酵才彻底引爆。 归根结底,还是因为大家之前对于中国科技行业和宏观环境的预期都太低了。 曲凯: 对,我觉得「东升西落」本质上是一种价值评判的回归,之前大家确实过于低估国内 AI 了,而 DeepSeek 就是一个典型代表。 ...
大模型“神仙打架”,掀起复现潮、技术大升级后,我们需要关注什么? | 万有引力
AI科技大本营· 2025-03-25 01:45
以下文章来源于CSDN ,作者万有引力 CSDN . 成就一亿技术人 作者 | 万有引力 出品 | CSDN(ID:CSDNnews) 在过去短短的几周里,大模型赛道的信息密度飙升至前所未有的高度。DeepSeek 连续 五天开源 ,直接引发了一场复现热潮;阿里巴巴通义实验室、 腾讯相继推出面向视觉文档的 RAG 系统 ViDoRAG、新一代混元快思考模型 Turbo S ,加速了大模型的演进步伐;马斯克用 20 万张 GPU 训练出的 Grok 3 ,超越了许多业界标杆,再次验证了"大力出奇迹"的定律; Claude 3.7 Sonnet 迎来编码能力大升级,AI 编程的技术平权时代正在加速到来; DeepSeek 论文与 Kimi"撞车",越来越多公司开始布局稀疏注意力与线性注意力机制,这些技术正成为 Transformer 之后的关键探索方向;此外, Manus 模式的"虚拟机"概 念迅速走红,正在重塑大模型的运行方式... 在这场眼花缭乱的技术竞赛背后,真正值得我们关注的是什么?DeepSeek 的五连发 究竟意欲何为?在 545% 的成本利润率之下,其他大模型公司是 否也能找到盈利空间?面对行业变 ...
从 R1 到 Sonnet 3.7,Reasoning Model 首轮竞赛中有哪些关键信号?
海外独角兽· 2025-03-03 13:10
作者:Cage、Yongxin、Siqi 编辑:Siqi DeepSeek R1 催化 了 reasoning model 的竞争:在过去的一个月里,头部 AI labs 已经发布了三个 SOTA reasoning models:OpenAI 的 o3-mini 和deep research, xAI 的 Grok 3 和 Anthropic 的 Claude 3.7 Sonnet。 随着头部 Al labs 先后释出自己的 reasoning model,新范式的第一轮竞赛暂时告一段落。 各家 reasoning model 各有长板,但都没有拉开大的领先优势:OpenAI 和 xAI 有着最强的 base model 和 竞赛解题能力,Anthropic 更关注真实世界的工程问题,Claude 3.7 Sonnet 的混合推理模型可能会成为 之后各家发布新模型的标准操作。 在这一波新模型密集发布后的间隙,我们对已有的 reasoning models 发布进行了总结梳理,除了平 行比较各些模型的实际能力和长板外,更重要的目标是识别出本轮发布中的关键信号。 整体上,我们还处于 RL Scaling 的早期 ...
DeepSeek开源引领AI普惠化浪潮
Wind万得· 2025-03-02 22:40
以下文章来源于RimeData 来觅数据 ,作者来觅研究院 RimeData 来觅数据 . 全面的一级市场数据平台 导读: 2025年2月24日起,DeepSeek开始为期5天的代码开源周,开源了FlashMLA、DeepEP、DeepGEMM等代码库。2月28日,OpenAI发布其最 新一代基础模型GPT-4.5(非推理模型),号称是迄今为止数据规模最大、知识最为丰富的聊天模型。可见,AI正以惊人的速度在发展。DeepSeek 的开源策略对行业带来哪些影响?全球AI大模型的进展如何?GPT-4.5模型有何特点?行业投融资情况如何?本文尝试分析和探讨。 01 DeepSeek开源策略影响 DeepSeek,全称为杭州深度求索人工智能基础技术研究有限公司,成立于2023年,是一家由知名私募巨头幻方量化孕育而生的创新型科技公司,专 注于开发先进的大语言模型(LLM)及相关技术。自成立以来,DeepSeek已相继发布了多款产品,包括DeepSeek Coder、DeepSeek LLM、 DeepSeek V2、DeepSeek V3、DeepSeek R1等。 2024年12月26日,DeepSeek正式上线De ...
专家访谈汇总:DeepSeek催生AI耳机概念股
阿尔法工场研究院· 2025-02-27 10:31
1 、 《 DeepSeek推动AI产业变革》摘要 ■ 模型能够自动从分析师报告中提取出市场趋势、产业链信息及企业财务数据,为量化投资模型提供 有价值的输入数据。 ■ 模型可通过情感分析等技术帮助投研人员从新闻、社交媒体、报告等文本中提取出相关情绪和观 点,进一步优化量化投资模型对市场动向的理解。 ■ 通过ChatGPTTask和Operator等智能体,投研人员可以自动执行如定期获取信息、自动化浏览网页 等任务。 ■ 这些智能体能够替代人类完成许多重复性、机械性的工作,从而让投研人员有更多的时间专注于价 值创造性工作。 ■ 通过构建知识库,投研人员可以便捷地从历史数据和报告中提取信息,甚至通过直接提问获得相关 答案。 ■ 对于不希望投入过多硬件和运维成本的投研机构,可以选择大模型API服务,如 OpenRouter、火 山引擎、阿里云 等平台提供的API。 ■ 使用 Ollama 等工具进行本地化部署,简化了大模型的安装和运行流程,同时保障了数据隐私和安 全性。 ■ 大模型虽具备强大的信息处理能力,但依赖模型的决策可能导致过度依赖自动化分析,忽视了人类 专业判断的作用,可能造成风险管理不足。 ■ 模型的输出 ...
晚点播客丨MiniMax 闫俊杰聊大模型 2024:一个非共识判断引起的回声
晚点LatePost· 2025-01-22 13:56
"更好的模型可以导向更好的应用,但更好的应用和更多用户并不会导向更好的模型。" 文丨程曼祺 * 头图:Dota 2019 国际邀请赛决赛(TI9)中,OG 战队的 Ana 使用 IO(小精灵,图中球形发光体)的经典作战,OG 在 TI9 中夺冠。为什么用这个图?播客里有 答案。 ▲扫描上图中的二维码,可收听播客。《晚点聊 LateTalk》#99 期节目。欢迎在小宇宙、喜马拉雅、苹果 Podcast 等渠道关注、收听我们。 《晚点聊 LateTalk》是《晚点 LatePost》 推出的播客节目。"最一手的商业、科技访谈,最真实的从业者思考。" 上周四,我们发布图文访谈:《 晚点对话 MiniMax 闫俊杰:千万别套用移动互联网的逻辑来做 AI 》,这是这次访谈的音频版。 闫俊杰的一些 "非共识" 判断,引起不少讨论。 他认为,模型能力和用户规模并不是直接的飞轮关系:"更好的模型可以导向更好的应用,但更好的应用和更多用户并不会导向更好 的模型。" 而今天(1 月 22 日)字节跳动发布 Doubao-1.5-pro 模型的技术报告里则提到:"依托字节在推荐、搜索和广告领域的 AB Test 经 验,研发了基于 ...
她为何被雷军挖角
投资界· 2025-01-21 07:35
以下文章来源于南风窗 ,作者朱秋雨 南风窗 . AI小厂崛起。 作者 | 朱秋雨 来源 | 南风窗 (ID:shangyejingxiang) 2024年末,一个中国AI小厂,凭借过硬的技术,获得了全球铺天盖地的关注。 圣诞节过后,海外社交媒体以及技术论坛Github都在讨论一个最新发布的开源大模型, DeepSeek-V3。它被外国网友冠以名号——"来自东方的神秘力量"。 多个评测报告里,DeepSeek-V3在世界开源模型之中处在第一梯队,超过扎克伯格的 LLaMa 3.1。拿它比GPT-4o以及Claude 3.5两个最顶尖大模型也毫不逊色,甚至, 其在数学推理、代码生成和长文本处理等指标上,表现更强。 这还不是中国AI公司DeepSeek(中文名:深度求索)全部的"拿手好戏"。更让美国硅 谷等同行摸不着头脑的是,DeepSeek公布的53页技术报告显示,其训练顶尖大模型只 用了2048张H100的GPU集群,花费53天,共计耗费557.6万美元。有专业人员指 出,同等水平之下,世界AI大厂至少要用1.6万张以上的GPU,有的甚至需要10万张 GPU并行训练。 OpenAI早期成员安德烈·卡帕西感慨,D ...
AI正在诞生一个万亿级公司
投资界· 2024-12-25 08:24
人工智能"加减乘除"。 报道 I 投资界PEdaily 2 0 24年12月1 0 - 11日,由中共重庆市委金融委员会办公室指导,清科创业、投资界主 办,重庆渝富控股集团联合主办的"第二十四届中国股权投资年度大会"走进西部金融中 心重庆。作为股权投资行业晴雨表,本次大会将以"万象耕新"为主题,回顾行业风云, 重塑格局策略,探索价值发现,持续为中国股权投资行业注入力量。 本场《人工智能+-×÷》圆桌论坛,由光速光合合伙人 孙健 主持,对话嘉宾为: 真格基金 合伙人 刘元 啟赋资本 合伙人 宋昶 广州基金 首席投资官 易沙 合力投资 管理合伙人 张敏 以下为对话实录, 经投资界(ID:peda il y 2 0 1 2)编辑: 孙健 :很荣幸主持这场圆桌讨论,主题是人工智能加减乘除,为什么是加减乘除?我在 想,是不是可能半年前人工智能还处于(X),发展到今天大家面临着各种各样的疑问 和困惑,就演变成了一个加减乘除,不知道该选择哪一个符号。在开场前,还是请大家 先自我介绍。 张敏 :我来自合力投资,主要关注早期投资,2001年进入到天使投资,现在做了2 3年。 易沙 :广州基金是由广州市委、市政府为推进广州产业转 ...
AI 月报:马斯克加速 GPU 竞赛;大模型真撞墙了? 风口转到 Agent
晚点LatePost· 2024-12-11 14:30
新栏目上线试运行。 文丨 贺乾明 编辑丨黄俊杰 到了 11 月,越来越多的人说,成就 OpenAI 的这条路似乎撞到了墙: 多家媒体报道,Google、OpenAI、Anthropic 等公司,开发下一代模型时,都没能像前些年那样让模型能力大幅提升。 硅谷风投 a16z 创始合伙人、投资了 OpenAI 等多家大模型公司的马克·安德森(Marc Andreessen)说:"我们以相 同的速度增加(GPU),根本没有智能提升。" OpenAI 联合创始人、前首席科学家伊尔亚·苏茨克维 (Ilya Sutskever) 说:"2010 年代是扩大规模的时代,现在我 们再次回到了需要奇迹和新发现的时代。" 这些公司的高管否认了 "撞墙" 的说法,也有证据表明他们仍在想办法突破,毕竟建设更大规模的算力中心的势头并没 有放缓,甚至还在加速。 他们同步在大模型应用上倾注更多的资源。从 OpenAI、Anthropic 到 Google、微软,再到风投机构,都把 Agent——让 大模型理解人类指令,调度数据库和工具完成复杂任务的系统——当作下一个赛点。 11 月,ChatGPT 迎来两周年,却是 OpenAI 官方相对沉 ...
独家专访 Tripo CMO,揭秘如何实现 3D 用户破圈增长和多社区联动策略
深思SenseAI· 2024-09-30 03:04
Builders 是由 @Magineer、@有新Newin 以及 @深思SenseAI 联合推出的人物专栏,旨在发现与分享更多的优秀出海创业团队与独立开发者,我们将 定期邀请生态范围内的创始人与团队展开对话。 Tripo.AI 的迭代与未来蓝图 我们尝试基于文章内容,提出更多发散性的推演和深思,欢迎交流。 - 产品和技术能力是生成模型类公司的基本盘 ,Tripo.AI 早期从"生成快"这个点突破,在数据积累和 Scaling law 上坚持推进。 今天我们邀请到的嘉宾是 VAST CMO Sienna,邀请她和我们分享 VAST 的产品 Tripo.AI 在过去的一年时间中如何找到自己的用户,并探索用户增 长。 - 用户不断破圈很重要 , 从AI科技爱好者,扩展到泛互联网3D设计和实体工业3D打印设计,目前也开始吸引 Roblox 平台的内容消费者。 在访谈中,我们深入探讨了目前 VAST 的产品和技术能力,拆解了目前 Tripo.AI 的核心用户画像及对应的商业模式。同时,由于 3D 内容资产天然比 较难买量传播,Tripo.AI 摸索出了一条社区运营为核心的破圈策略,Sienna 在访谈中为我们分享了很 ...