开源模型

Search documents
速递|筹集400亿美元后,OpenAI宣布开源模型回归计划,推理能力模型即将面世
Z Potentials· 2025-04-01 03:49
OpenAI 于 3 月 31 日周一宣布,即将在未来数月推出自 GPT-2 以来首个具备推理能力的开源模型。 OpenAI 同时宣布完成了历史上最大的私人融资之一,以 3000 亿美元的估值筹集了 400 亿美元。 约 180 亿美元的资金将用于 OpenAI 的 Stargate 基础设施项目,该项目旨在在美国建立一个人工智能数据中心网络。 图片来源: OpenAI 奥特曼在周一下午的 X 平台上扩展了 OpenAI 的开放模型计划,表示 OpenAI 即将推出的开放模型将具备"推理"能力,类似于 OpenAI 的 o3-mini 。 OpenAI 表示,它计划在"未来几个月"发布自 GPT-2 以来的第一个"开放"语言模型。 OpenAI 计划举办开发者活动以收集反馈,并在未来展示模型的原型。第一次开发者活动将在几周内在旧金山举行,随后将在欧洲和亚太地区进行会议。 在最近的一次 Reddit 问答中, OpenAI 的 CEO 奥特曼表示,他认为 OpenAI 在开源其技术方面方向有调整空间。 " 我个人认为我们需要找到一种不同的开源策略, "奥特曼说。"并不是所有 OpenAI 的人都持这种观点,这也 ...
3D版DeepSeek卷起开源月:两大基础模型率先SOTA!又是VAST
量子位· 2025-03-28 10:01
衡宇 鱼羊 发自 凹非寺 量子位 | 公众号 QbitAI 3D生成版DeepSeek再上新高度! 国产、易用、性能强且开源—— 新模型一露面就刷新SOTA,并且 第一时间加入开源全家桶 。 顺时针转个圈圈给大家看,效果是这样: 加上"皮肤"是这样: 再来一个,效果是这样: 肉眼可见,这次妥妥升级变成了更细节的细节控~ 以上效果,都来自 3D大模型明星初创公司VAST ,其刚刚上新的两个基础模型,TripoSG和TripoSF,为团队的最新研发成果。该团队去年3 月开源了TripoSR,在开源3D生成基础模型中爆火全球。 TripoSG ,发布即开源,一露面就刷新开源3D生成模型SOTA,让广大开发者第一时间享受技术进步的成果。 TripoSF ,目前为开源第一阶段,已经用实力证明了自己:横扫一切开源和闭源的现有方法,拿下新SOTA。 你就说秀不秀吧 (手动狗头) ?! ——但基础模型还只是VAST最近大秀一波技术肌肉的上半程表演。 量子位获悉, 接下来VAST要连续开源一个月,每周都有新开源项目公布 。而TripoSG和TripoSF是开源月里第二周的项目。 在整个开源月里,除了第一波单张图像端到端生成三维 ...
华尔街这是“约好了一起唱空”?巴克莱:现有AI算力似乎足以满足需求
硬AI· 2025-03-27 02:52
点击 上方 硬AI 关注我们 巴克莱指出,2025年AI行业有足够的算力来支持15亿到220亿个AI Agent。AI行业需从"无意义基准测试"转向实用的Agent产品部署,低推理成本是盈利关键,开源模型将降低 成本。尽管算力看似充足,但高效、低成本Agent产品的专用算力仍有缺口。 硬·AI 作者 |鲍亦龙 编辑 | 硬 AI 继TD Cowen后,巴克莱似乎也开始唱空AI算力。 3月26日,巴克莱发布最新研究称,2025年全球AI算力可支持15-220亿个AI Agent,这足以满足美国和欧盟1亿多白领工作者和超过10亿企业软件许可证的 需求。而同日 TD Cowen分析师称支撑人工智能运算的计算机集群供过于求 。 巴克莱认为现有的AI算力已经足够支持大规模AI代理的部署,主要基于以下三点: 行业推理容量基础 :2025年全球约有1570万个AI加速器(GPU/TPU/ASIC等)在线,其中40%(约630万个)将用于推理, 而这些推理算力中约一半(310万个)将专门用于 Agent/聊天机器人服务 ; 可支持大量用户 :根据不同模型的计算需求,现有算力可支持15亿到220亿个AI代理,这足以满足美国和欧 ...
Z Potentials|沈振宇,一个潮玩公司如何做出世界第一的AIGC模型平台
Z Potentials· 2025-03-26 03:49
推荐语 本期我们邀请到了沈振宇作为访谈嘉宾。这位曾被张一鸣直接招募、亲历字节跳动崛起的产品人,如 今已经完成了从图虫到千岛的两次创业蜕变。 在本次深度对话中,沈振宇分享了他对 AI 未来的独到见解: " 每个公司最终都会变成 AI 公司 " , 而 "AI 革命不可能只由少数人主导 " 。他坚信开源模型将主导未来,认为 " 技术秘密正在加速流动 " , 这也是他在千岛取得阶段性成功后,选择同步布局 AI 模型平台的战略考量。 作为一个已经服务超 10 万模型训练师、超 50 万个模型的平台, Tensor.Art 如何在激烈的全球竞争中 脱颖而出? 沈振宇的答案是构建双重护城河: " 模型规模和创作者规模 " ,同时坚持 " 低价才能带 来更大规模 " 的商业哲学。 他从字节学到的 " 以终为始 " 思维,让他能够 " 穿透短期噪音,看到那 些必然会发生的事情 " ,这也指导着他在 AI 时代的每一个决策。 在沈振宇看来, "AI 技术未来一定会像水电一样基础普及 " ,而 " 单一大模型的能力其实很有限 " , 我们需要大量微调模型来解决细分场景的问题。正如他所言: " 未来十年 AI 会改变一切 " ,而 ...
DeepSeek,上新!
证券时报· 2025-03-25 04:28
在保持原有技术框架的基础上,V3-0324模型针对性能、用户体验和实用性进行了优化。新版模型延续了V3系列的核心架构,总体积为6850亿参数,较此前版本的 6710亿有小幅增长。目前,最新模型已在官方网页、App小程序等入口开放,开源版本已上架开源网站。 整体来看,新版模型是一次小型的迭代升级,其主要的特点包括: 一是在模型性能方面,虽然DeepSeek并未给出新版模型的基准测试结果,但用户测试表明,其在生成复杂代码、数学问题求解、前端设计任务等方面表现更为出 色。其中,模型前端代码能力的提升是用户感知最明显的部分,有海外AI博主称,DeepSeek终于能在代码领域和Anthropic的Claude3.5/3.7Sonnet相媲美,还有专业 用户在体验后认为,V3-0324的提升幅度大约相当于Sonnet3.5到Sonnet3.6的提升。 | 3月24日晚间,DeepSeek发布了V3模型的最新更新版本——V3-0324模型。 | | --- | 责编:叶舒筠 校对: 刘星莹 (点击图片进入报名页面) 版权声明 证券时报各平台所有原创内容,未经书面授权,任何单位及个人不得转载。我社保留追 究相关 行 为主体法 ...
30天,DeepSeek改变了谁
投资界· 2025-02-19 07:46
以下文章来源于财经杂志 ,作者《财经》杂志 财经杂志 . 《财经》杂志官方微信。《财经》杂志由中国证券市场研究中心主办,1998年创刊,秉承"独立、独家、独到"的新闻理念,以权威性、公正性、专业性报 道见长,是政经学界决策者、研究者、管理者的必读刊物。 打破了几个"刻板共识"。 作者 | 《财经》杂志 来源 | 财经杂志 (ID: i-caijing) 2025年春节的前一周,节日气氛正浓,来自中国杭州的一家初创公司开始让华尔街投资人寝食难安。 杭州量化私募机构幻方旗下的大模型公司DeepSeek(深度求索)发布的一款开源AI模型,在多项测试中表现优于OpenAI的产品,且 研发成本不到600万美元。更让华尔街投资人震惊的是,DeepSeek1月20日发布R1模型,上线六天后同时登顶苹果App Store和谷 歌Play Store全球下载榜首,上线18天内,累计下载量已突破1600万次。随后在2月1日突破3000万大关,成为史上最快达成这一 里程碑的应用。 华尔街的担忧在于,目前投入数十亿美元用于构建大型AI模型的做法可能会打水漂,更廉价的替代方案将让华尔街人工智能的泡沫破 裂。泡沫破裂带来的资本市场危机短 ...