Workflow
DeepSeek V3模型
icon
Search documents
一文了解DeepSeek和OpenAI:企业家为什么需要认知型创新?
混沌学园· 2025-06-10 11:07
在这个 AI技术日新月异的时代,我们眼看着它不仅在改变生活,更在 改变着 商业规则。 AI可不只是那些冰冷的算法,它现在能像人一样思考、推理,甚至在某些方面 的表现超越了普通人 。这告诉我们,传统的技术和创新模式已经不够用了, 企业要想增长、要保持竞争力,就 需要 换个思路。 AI正在重新定义我们理解和实践商业创新的方式。 最近 , 混沌君旁听了 混沌学园的创始人李善友教授 的重磅 全新课程《认知型创新:从 OpenAI到DeepSeek》 。 这门课从企业创新的角度, 讲述了 全球两大顶尖 AI公司——OpenAI和DeepSeek是如何一步步走到今天的,他们究竟走过了怎样的创新之路。这对于我 们理解AI时代的技术创新和企业创新,提供了清晰且极具价值的路径。 教授 深挖 了 OpenAI最初的愿景和它如何对抗巨头的思路,解密大语言模型是如何诞生的 , 尤其是 AI能力如何从简单积累到惊人"涌现" 。 还 解读 了 DeepSeek如何在资源有限的情况下,走出一条"低成本高性能"的独特道路;更探讨 了 AI时代下,企业应该怎样构建一个能不断"涌现"创新的组织模式, 走向"技术领先"。 扫描下图二维码购买月卡 ...
小红书开源1420亿参数大模型,部分性能与阿里Qwen3模型相当
Tai Mei Ti A P P· 2025-06-10 01:07
在 AI 领域向来低调的社交平台小红书,近期开源了其首个自研大模型。 6月9日消息,小红书hi lab(Humane Intelligence Lab,人文智能实验室)团队近期在Github、Hugging Face等平台发布首款开源文本大模型dots.llm1。 | 1906 T. LETTORINGICE COUPALISON OF TRUSTOLUMEI ENRING THE THE OLL OUT THE LOOD TIGHT A | | --- | | n, n, and k represent the number of groups (experts) and the dimensions of each sub-GEMM problem, | | espectively. | 目前来看,dots.llm1大部分性能与阿里Qwen 2.5模型,部分性能与阿里Qwen 3模型相当。 具体来说,dots.llm1混合专家模型(MoE)模型拥有1420亿参数,使用11.2万亿token的非合成高质量训 练数据,在推理过程中仅激活140亿参数,能保持高性能的同时大幅度降低训练和推理成本。 此次小红书团队 ...
早餐 | 2025年5月16日
news flash· 2025-05-15 23:16
美联储主席鲍威尔:将重新评估2020版货币政策框架的"关键部分",长期利率可能走高,"供应冲 击"或成新常态。 美国4月PPI同比上涨2.4%低于预期,环比-0.5%,降幅创下五年来最大。美国4月零售销售环比 0.1%小幅超预期,消费者支出疲软显露端倪。 特朗普同阿联酋签2000亿美元商业协议,合作在阿联酋建5GW数据中心。卡塔尔的特朗普"礼 包"进一步揭开:主权财富基金拟十年在美投资5000亿美元。 伊朗称愿与美国达成协议。伊朗最高领袖顾问:伊朗愿承诺永不制造核武,换取美解除制裁。 哈马斯官员:若实现永久停火,可交出加沙地带控制权。 阿里Q4营收同比增7%不及预期,阿里云增长加速18%,AI收入连续七个季度三位数增长。 梁文锋参与发表回顾性论文:DeepSeek首次揭秘V3模型背后扩展方案。 Meta将推迟发布旗舰AI模型Behemoth,股价盘中跌超3%。 CoreWeave获英伟达持股7%,向OpenAI供40亿美元云计算产能。 伯克希尔Q1大砍银行股,清仓花旗,苹果持仓未变,啤酒制造商持仓翻倍,存在保密持仓。 沃尔玛Q1销售额增长2.5%略低于预期,CFO警告关税价格上涨可能从本月开始。 ...
谷歌前CEO称,中美差距已终结
Sou Hu Cai Jing· 2025-05-09 06:41
文︱陆弃 5月5日,《纽约时报》刊发了一篇耐人寻味的评论文章,作者不是别人,正是前谷歌首席执行官埃里克 ·施密特。这位曾长期代表硅谷秩序的人物,罕见地放下了美国科技优越感的傲慢,承认中国已经在人 工智能等前沿技术领域从"追赶者"转变为"并跑者"甚至"领跑者",直言"中国远远落后于美国的时代已 然终结"。如果说十年前这样的判断还会被视为"危言耸听",那么今天,这已成为西方智识阶层中最不 愿承认、却不得不正视的现实。 文章从DeepSeek、Temu、TikTok讲起,到人形机器人、电动汽车、工业制造,逐项列举了中国科技近 年来取得的突破。施密特指出,尽管美国对中国实施了严厉的芯片出口管制和技术打压,但这些压力并 没有使中国"退步",反而加速了其自主研发、产业迭代和人才体系的强化。"制裁的副作用",反而塑造 了更坚韧、更务实的技术生态。正如文章中那句讽刺性极强的笑话所说:"美国也应该制裁一下我们的 男足,这样他们就能踢得好点。" 在某种程度上,这是对"脱钩战略"的当头棒喝。美国想通过技术封锁遏制中国,但最后却惊讶地发现, 中国在芯片、AI大模型、机器人等领域的产业链不仅没有断裂,反而因压力而爆发出惊人的创造力。 ...
聚焦AI|中国AI数据中心的潜行加速
- ■■- 核心摘要 2022年12月ChatGPT发布,引发全球市场对于AI发展的关注。伴随美国头部云厂商不断提升资本开 支,AI基建领域产生众多投资机会。涉及产品包括变压器、UPS(不间断电源)、服务器电源、液 冷;甚至由于AIDC(AI数据中心)建设的火爆,导致电网接入点稀缺,核电成为AIDC的优质电 源,包括核电公司以及可控核聚变公司均受到关注。 我们复盘ChatGPT发布后,海外AIDC基建类产业链股价走势,可以发现各区间段收益率靠前的细分 赛道,基本对应当时AI产业演进中的核心矛盾或进展。从规律来看,大致可以分为四个阶段:1) ChatGPT出现带来算力需求高增,期间服务器电源关注度攀升;2)算力高增推动芯片技术迭代,相 应导致功耗提升,服务器电源、液冷需求提升;3)AIDC进入实际建设阶段,AI基建(备用电源、 变压器需求增加);4)AIDC建设导致电网接入点难寻,燃气轮机、核电相应概念热度提升。 综合以上分析,对于中国AIDC各细分产业链,我们观点如下: 传统备用电源有望享受量价齐升红利。 海外头部企业整体指引2025年营业利润率有望提升。我们认 为主要原因有(1)需求量端,AI数据中心建设浪 ...