V3模型

Search documents
2025年上半年中国商界十大热门人物
Sou Hu Cai Jing· 2025-07-02 03:40
评选依据:基于行业影响力、创新突破性、社会话题度及企业战略变革性,综合企业营收增速、技术突破、舆论场声量等维度,Z察遴选出2025年上半 年中国商界十大热门人物。 2025年上半年,中国商界在技术革命、全球化竞争与社会责任的多重激荡中,涌现出一批极具争议性与引领性的热门人物。 他们或因颠覆性战略改写行业格局,或因争议性言论引爆舆论场,共同勾勒出中国经济转型的复杂图景。 本榜单聚焦梁文锋、饺子、王宁、董明珠等十位商界人物,其故事不仅关乎企业兴衰,更折射出中国商业文明在效率、伦理与创新之间的持续进化。 1.梁文锋(深度求索) 关键词:AI通用大模型、中美博弈、引领全球今年上半年,DeepSeek创始人梁文锋成为全球AI领域的焦点人物。 去年底今年初,他创立的深度求索公司推出了DeepSeek 人工智能通用大模型,引爆了全球市场。 2月,梁文锋参加了民营企业座谈会。 3月,推出 DeepSeek-V3模型更新版。 持续推动DeepSeek向通用人工智能迈进。 他已成为中国人工智能领域的领军人物。 6月,梁文锋以1846.2亿元财富首次上榜即闯入新财富创富榜前10强。 2. 雷军(小米集团) 关键词:汽车安全、生态扩 ...
一文了解DeepSeek和OpenAI:企业家为什么需要认知型创新?
混沌学园· 2025-06-10 11:07
在这个 AI技术日新月异的时代,我们眼看着它不仅在改变生活,更在 改变着 商业规则。 AI可不只是那些冰冷的算法,它现在能像人一样思考、推理,甚至在某些方面 的表现超越了普通人 。这告诉我们,传统的技术和创新模式已经不够用了, 企业要想增长、要保持竞争力,就 需要 换个思路。 AI正在重新定义我们理解和实践商业创新的方式。 最近 , 混沌君旁听了 混沌学园的创始人李善友教授 的重磅 全新课程《认知型创新:从 OpenAI到DeepSeek》 。 这门课从企业创新的角度, 讲述了 全球两大顶尖 AI公司——OpenAI和DeepSeek是如何一步步走到今天的,他们究竟走过了怎样的创新之路。这对于我 们理解AI时代的技术创新和企业创新,提供了清晰且极具价值的路径。 教授 深挖 了 OpenAI最初的愿景和它如何对抗巨头的思路,解密大语言模型是如何诞生的 , 尤其是 AI能力如何从简单积累到惊人"涌现" 。 还 解读 了 DeepSeek如何在资源有限的情况下,走出一条"低成本高性能"的独特道路;更探讨 了 AI时代下,企业应该怎样构建一个能不断"涌现"创新的组织模式, 走向"技术领先"。 扫描下图二维码购买月卡 ...
小红书开源1420亿参数大模型,部分性能与阿里Qwen3模型相当
Tai Mei Ti A P P· 2025-06-10 01:07
在 AI 领域向来低调的社交平台小红书,近期开源了其首个自研大模型。 6月9日消息,小红书hi lab(Humane Intelligence Lab,人文智能实验室)团队近期在Github、Hugging Face等平台发布首款开源文本大模型dots.llm1。 | 1906 T. LETTORINGICE COUPALISON OF TRUSTOLUMEI ENRING THE THE OLL OUT THE LOOD TIGHT A | | --- | | n, n, and k represent the number of groups (experts) and the dimensions of each sub-GEMM problem, | | espectively. | 目前来看,dots.llm1大部分性能与阿里Qwen 2.5模型,部分性能与阿里Qwen 3模型相当。 具体来说,dots.llm1混合专家模型(MoE)模型拥有1420亿参数,使用11.2万亿token的非合成高质量训 练数据,在推理过程中仅激活140亿参数,能保持高性能的同时大幅度降低训练和推理成本。 此次小红书团队 ...
DeepSeek核心高管离职创业,瞄准Agent赛道
虎嗅APP· 2025-06-09 12:54
以下文章来源于AGI接口 ,作者宋思杭 AGI接口 . AI卷起的财富风暴。 出品|虎嗅科技组 作者|宋思杭 值得注意的是,这并非AI行业首次出现核心高管离职创业的案例。从OpenAI的多位联合创始人出 走,到国内大厂AI团队的人才分流,高端AI人才的流动已成为行业常态。 一个近两年在OpenAI发生的典型案例是,曾一直与奥特曼不和的首席科学家伊利亚在2024年5月 离开公司后一个月,便联合前Y Combinator合伙人格罗斯(Daniel Gross)和前OpenAI工程师列 维(Daniel Levy)共同创立Safe Superintelligence(简称"SSI"),迄今为止,这家公司总融资额 已达到30亿美元,第二轮融资后估值直接飙升至320亿美元。SSI也因此成为史诗级独角兽。 然 而 , 尽 管 关 于 这 位 DeepSeek 核 心 高 管 的 创 业 项 目 并 无 相 关 融 资 披 露 , 但 这 并 不 妨 碍 , 从 DeepSeek"出走"的人也有可能创造下一个独角兽神话。 而这种现象背后恰反映了AI行业的几个特点:一是技术迭代速度快,新方向不断涌现,为创业提 供了丰富的机会 ...
刚刚!DeepSeek,突传重磅!
天天基金网· 2025-05-29 05:41
进入5月份之后,业内一直在期盼DeepSeek推出R2模型。但时至今日,其神秘面纱依然未被揭开。不过,今天 晚上,突然有消息传来:DeepSeek-R1模型已完成小版本试升级,可前往官方网页、APP、小程序测试(打开 深度思考),API接口和使用方式保持不变。 不过,DeepSeek官方此次并没有公布版本更新的具体内容。今年3月,DeepSeek曾对V3模型进行小版本升级, 同样是通过官方交流群率先宣布,随后公布了具体更新内容。此前,也有许多关于R2大模型的传闻出现,比 如"参数规模被曝达到惊人的1.2万亿,相比前代R1的6710亿参数几乎翻倍等"。但截至目前,并未获得官方证 实。 DeepSeek似乎在憋大招! 与此同时,当下已经进入到DeepSeek的扩散阶段,不断有公司和行业接入该公司的模型。那么,沉寂已久的 科技股是否会因此再起风云? De e pSe e k-R1升级 R2没有来,但R1升级了。深度求索公司代表周三在官方微信群中发布的帖子称,DeepSeek完成了"小规模试用 升级",欢迎前往官方网页、APP、小程序测试(打开深度思考),API接口和使用方式保持不变。 然而,自那之后,DeepSee ...
刚刚!DeepSeek,突传重磅!
券商中国· 2025-05-28 13:39
DeepSeek似乎在憋大招! 近日, 西藏大学 推出"藏大智言"DeepSeek平台,人工智能教学服务将延伸至雪域高原。目前西藏自治区昌都 市政务云已完成DeepSeek大模型部署。拉萨高新区通过搭建DeepSeek政务大模型应用,成为拉萨市打造高原 特色"智慧政务"的试点先锋。 进入5月份之后,业内一直在期盼DeepSeek推出R2模型。但时至今日,其神秘面纱依然未被揭开。不过,今天 晚上,突然有消息传来:DeepSeek-R1模型已完成小版本试升级,可前往官方网页、APP、小程序测试(打开 深度思考),API接口和使用方式保持不变。 不过,DeepSeek官方此次并没有公布版本更新的具体内容。今年3月,DeepSeek曾对V3模型进行小版本升级, 同样是通过官方交流群率先宣布,随后公布了具体更新内容。此前,也有许多关于R2大模型的传闻出现,比 如"参数规模被曝达到惊人的1.2万亿,相比前代R1的6710亿参数几乎翻倍等"。但截至目前,并未获得官方证 实。 与此同时,当下已经进入到DeepSeek的扩散阶段,不断有公司和行业接入该公司的模型。那么,沉寂已久的 科技股是否会因此再起风云? De e pSe ...
紫金港资本陈军:依然聚焦有长期主义的优秀企业和企业家
Sou Hu Cai Jing· 2025-05-21 03:56
此文为融中特别策划·《投资人:快答2025》系列报道第十九篇。 前言: 2025年,以一副猝不及防的形态出现,国防、科技、文化、国际政治领域的变化让人目不暇接。回望 过去几年,我们共同经历了一场前所未有的全球性震荡。疫情、战争、经济衰退、地缘政治……这些 关键词充斥着我们的视野,也深刻地改变着世界的运行规则。然而,危机往往与机遇并存,动荡中也 孕育着新的希望。 2025年,作为投资人,我们比任何人都更深刻地感受到时代浪潮的冲击,更能深切的感受到春江水 暖。站在产业前端,立在创新前沿,投资人对于已经到来的2025有着什么样的期冀和见解? 我们邀请了多位顶尖投资人,将以他们敏锐的洞察力和独到的见解,为我们勾勒出一幅未来经济、投 资的路线图。 2025年,创投行业行至一个关键的十字路口。随着全球经济形势之复杂变化和地缘政治的不确定性,市场面临着 全新的挑战与机遇。作为有着其中,见证过多个投资周期起伏的紫金港资本,凭借其稳健的投资策略和深刻的行 业洞察,在不确定性中寻找着确定性,为投资者照亮前行的道路。 成立于2014年的紫金港资本,以学院派投资风格著称,核心成员多为浙大校友,他们不仅拥有丰富的投资与企业 管理经验, ...
早餐 | 2025年5月16日
news flash· 2025-05-15 23:16
美联储主席鲍威尔:将重新评估2020版货币政策框架的"关键部分",长期利率可能走高,"供应冲 击"或成新常态。 美国4月PPI同比上涨2.4%低于预期,环比-0.5%,降幅创下五年来最大。美国4月零售销售环比 0.1%小幅超预期,消费者支出疲软显露端倪。 特朗普同阿联酋签2000亿美元商业协议,合作在阿联酋建5GW数据中心。卡塔尔的特朗普"礼 包"进一步揭开:主权财富基金拟十年在美投资5000亿美元。 伊朗称愿与美国达成协议。伊朗最高领袖顾问:伊朗愿承诺永不制造核武,换取美解除制裁。 哈马斯官员:若实现永久停火,可交出加沙地带控制权。 阿里Q4营收同比增7%不及预期,阿里云增长加速18%,AI收入连续七个季度三位数增长。 梁文锋参与发表回顾性论文:DeepSeek首次揭秘V3模型背后扩展方案。 Meta将推迟发布旗舰AI模型Behemoth,股价盘中跌超3%。 CoreWeave获英伟达持股7%,向OpenAI供40亿美元云计算产能。 伯克希尔Q1大砍银行股,清仓花旗,苹果持仓未变,啤酒制造商持仓翻倍,存在保密持仓。 沃尔玛Q1销售额增长2.5%略低于预期,CFO警告关税价格上涨可能从本月开始。 ...
谷歌前CEO称,中美差距已终结
Sou Hu Cai Jing· 2025-05-09 06:41
文︱陆弃 5月5日,《纽约时报》刊发了一篇耐人寻味的评论文章,作者不是别人,正是前谷歌首席执行官埃里克 ·施密特。这位曾长期代表硅谷秩序的人物,罕见地放下了美国科技优越感的傲慢,承认中国已经在人 工智能等前沿技术领域从"追赶者"转变为"并跑者"甚至"领跑者",直言"中国远远落后于美国的时代已 然终结"。如果说十年前这样的判断还会被视为"危言耸听",那么今天,这已成为西方智识阶层中最不 愿承认、却不得不正视的现实。 文章从DeepSeek、Temu、TikTok讲起,到人形机器人、电动汽车、工业制造,逐项列举了中国科技近 年来取得的突破。施密特指出,尽管美国对中国实施了严厉的芯片出口管制和技术打压,但这些压力并 没有使中国"退步",反而加速了其自主研发、产业迭代和人才体系的强化。"制裁的副作用",反而塑造 了更坚韧、更务实的技术生态。正如文章中那句讽刺性极强的笑话所说:"美国也应该制裁一下我们的 男足,这样他们就能踢得好点。" 在某种程度上,这是对"脱钩战略"的当头棒喝。美国想通过技术封锁遏制中国,但最后却惊讶地发现, 中国在芯片、AI大模型、机器人等领域的产业链不仅没有断裂,反而因压力而爆发出惊人的创造力。 ...
【广发金工】DeepSeek定量解析基金季报行业观点及行业轮动策略构建
广发金融工程研究· 2025-04-08 03:35
广发证券资深金工分析师 李豪 lhao@gf.com.cn 广发证券首席金工分析师 安宁宁 anningning@gf.com.cn 广发金工安宁宁陈原文团队 摘要 大语言模型在金融领域的应用: 近年来,人工智能技术的快速发展推动了大语言模型(LLMs)的革新。作为最前沿的技术之一,大语言 模型正在广泛应用于各行各业。金融行业作为一个高度依赖数据分析和信息处理的领域,对先进的人工 智能技术有着极大的需求。而LLMs凭借其强大的文本理解能力、信息提取能力以及推理和预测能力, 正在逐步改变传统的金融分析和决策方式,为投资管理、市场分析、风险控制等多个领域带来了新的机 遇。 DeepSeek定量解析基金季报行业观点及行业轮动策略构建: 本文中,我们尝试通过DeepSeekV3模型,对于基金季报观点文本中的行业观点进行定量解析,并以此 出发构建行业轮动策略。具体来看,首先我们筛选存续时间较长的主动型权益基金样本,并提取样本基 金不同季度报告期季报中的观点部分文本;而后我们将观点文本输入至DeepSeek模型,加入特定提示 词控制输出的格式,并基于输出结果构建基金季报行业观点指标;最后我们基于基金季报行业观点指标 及观 ...