开源

Search documents
百度文心大模型4.5系列模型开源,国内首发平台GitCode现已开放下载!
Cai Fu Zai Xian· 2025-06-30 07:40
6月30日,百度文心大模型4.5系列模型正式开源,并在国内领先的开源平台GitCode首发上线,为广大 企业、开发者提供真正可用、好用、可落地的大模型解决方案。 现在,全球开发者、企业、研究机构等均可免费在GitCode平台直接访问并下载体验文心大模型4.5开源 系列,支持部署、微调等各种不同场景的使用需求。 欢迎下载体验,开启你的文心大模型之旅 文心4.5系列模型均使用飞桨深度学习框架进行高效训练、推理和部署。在大语言模型的预训练中,模 型FLOPs利用率(MFU)达到47%。实验结果显示,该系列模型在多个文本和多模态基准测试中达到 SOTA水平,在指令遵循、世界知识记忆、视觉理解和多模态推理任务上效果尤为突出。模型权重按照 Apache 2.0协议开源,支持开展学术研究和产业应用。此外,基于飞桨提供开源的产业级开发套件,广 泛兼容多种芯片,降低后训练和部署门槛。 GitCode平台:开源创新的理想土壤 GitCode平台自2023年9月22日上线以来发展迅猛,已汇聚了超过620万的注册用户,月活用户达120万, 已经成为颇具影响力的开源社区,庞大的用户基础和活跃的社区氛围为文心大模型的推广和应用提供了 广 ...
华为首个开源大模型来了!Pro MoE 720亿参数,4000颗昇腾训练
Hua Er Jie Jian Wen· 2025-06-30 07:27
国产大模型开源竞争进入新阶段,华为首次开源盘古大模型核心能力。 此次开源正值国产大模型开源浪潮兴起之际。继DeepSeek-R1成功后,MiniMax、阿里巴巴、月之暗面等头部厂商陆续升级开源模型,推动大模型价格下探 60%-80%,加速应用普及。 模型引入"快思考"和"慢思考"双系统 华为此次开源包括三个主要组件:盘古Pro MoE 72B模型权重和基础推理代码已正式上线开源平台,基于昇腾的超大规模MoE模型推理代码同步发布,盘古 7B相关模型权重与推理代码将于近期上线。 据开源开发者平台GitGo信息,盘古Pro MoE基于MoGE架构构建,总参数量720亿,激活参数量160亿。该模型专门针对昇腾硬件优化,在昇腾300I Duo推理 服务器上提供极具性价比的模型推理方案。 6月30日,华为宣布开源盘古70亿参数稠密模型和盘古Pro MoE 720亿参数混合专家模型,同时开放基于昇腾的模型推理技术。这是华为首次将盘古大模型的 核心能力对外开源。 华为表示,720亿参数的盘古Pro MoE模型在昇腾800I A2上实现单卡1148 tokens/s的推理吞吐性能,通过投机加速技术可进一步提升至1528 tok ...
刚刚,华为发布!
中国基金报· 2025-06-30 04:05
【导读】华为首次开源盘古大模型,包含 70 亿和 720 亿参数模型 中国基金报记者 张燕北 6 月 30 日,华为宣布开源盘古 70 亿参数的稠密模型、盘古 Pro MoE 720 亿参数的混合专 家模型,以及基于昇腾的模型推理技术。 华为表示,此举是华为践行昇腾生态战略的又一关键举措,推动大模型技术的研究与创新发 展,加速推进人工智能在千行百业的应用与价值创造。 据华为官网信息,此次是华为首次将盘古大模型的核心能力开源,本次开源主要包括:盘古 Pro MoE 72B 模型权重、基础推理代码,已正式上线开源平台;基于昇腾的超大规模 MoE 模型推理代码,已正式上线开源平台;盘古 7B 相关模型权重与推理代码将于近期上线开源 平台。 华为表示, " 我们诚邀全球开发者、企业伙伴及研究人员下载使用,反馈使用意见,共同完 善。 " (来源:开源开发者平台 GitGo ) 据了解,盘古是华为推出的一系列超大规模人工智能预训练模型,涵盖自然语言处理、计算 机视觉、科学计算等多个领域。其名称寓意 " 开天辟地 " ,象征着华为在人工智能基础研究 和行业应用上的突破性探索。盘古模型自发布以来,已在多个行业中实现落地,包括 ...
华为缘何开源盘古大模型?
Tai Mei Ti A P P· 2025-06-30 03:23
这也是华为首度宣布开源盘古大模型,大模型开源的本质是以开放换生态,以生态养技术。 对于华为而言,本次并不是全面开源,而是选择了两款用量相对较多的模型,70亿参数的稠密模型参数 量适中、性能均衡、部署门槛较低,在智能客服、知识库等多种场景中均可应用;盘古Pro MoE 720亿 参数的混合专家模型凭借其稀疏激活、动态路由和多专家协作的特性,更适合处理相对复杂的任务。 不排除华为未来继续开源的可能性,一般而言,华为在做好技术稳定性等优化的基础上,先用两款模型 试验开发者和市场反应,在可用性和易用性方面持续优化,再进一步开源。开源只是第一步,如何持续 运营开源生态,远比开源本身更重要。 其中值得关注的是,本次华为还开源了基于昇腾的模型推理技术,国产AI之难,难在芯片,更难在生 态,如果要让开发者更好地调用盘古等国产模型,就要让底层的AI基础设施实现更优适配,这也是华 为开源基于昇腾的模型推理技术的意义。 6月30日消息,华为正式宣布开源盘古70亿参数的稠密模型、盘古Pro MoE 720亿参数的混合专家模型和 基于昇腾的模型推理技术。 华为官方表示,此举是华为践行昇腾生态战略的又一关键举措,推动大模型技术的研究与创 ...
百度正式开源文心大模型4.5系列模型
第一财经· 2025-06-30 03:12
6月30日,百度正式开源文心大模型4.5系列模型,涵盖47B、3B激活参数的混合专家(MoE)模 型,与0.3B参数的稠密型模型等10款模型,并实现预训练权重和推理代码的完全开源。目前,文心 大模型4.5开源系列可在飞桨星河社区、HuggingFace等平台下载部署使用,同时开源模型API服务 也可在百度智能云千帆大模型平台使用。 ...
红帽:AI的未来是开放的,开源方案可加快释放生成式AI潜能
Huan Qiu Wang· 2025-06-30 01:23
【环球网科技报道 记者 林迪】"混合云已成为企业运营的普遍选择,它在成本、便捷性、安全性方面具备显著优势。而 AI 的发展更是日新月异,生成式 AI 已深刻影响我们的生活与企业运营。"近日,红帽全球副总裁兼大中华区总裁曹衡康对记者表示,红帽致力于以开源模式推动 AI 发展,成为开源 AI 领域的 重要驱动力量。 近期,2025 年红帽全球峰会发布了众多前沿技术以及产品更新,旨在助力企业更好地应对当下数字化转型浪潮中的诸多挑战,为企业未来的发展注入强劲 动力。近期,红帽相关负责人对此进行了深入分享与解读。 红帽在此次峰会还重点推出 OpenShift 虚拟化服务升级版。该服务可在多云环境下运行,支持 AWS、Azure、Google Cloud 等主流云平台。自推出以来, OpenShift 虚拟化客户增长迅猛,不到两年客户数量增长 3 倍,生产中的集群数量翻倍,管理的虚拟机数量也实现 3 倍增长。其凭借卓越性能与广泛兼容 性,助力企业灵活构建虚拟化环境,满足多样业务需求。 值得关注的是,红帽 AI 推理服务器的发布旨在为 AI 发展注入新活力。该服务器基于热门的 vLLM 架构打造,聚焦于提升推理效率与性能。 ...
第一桶金的来源与积累之难
集思录· 2025-06-29 14:22
经常看到讨论投资收益率的帖子。按美国FIRE那套理论,年化4%的收益目标看起来好像不难实 现。 家里支持的启动资金? 或者...其他不那么方便明说的路径?(懂的都懂,很多人这部分经历可能就选择性略过了) 很好奇集思录的各位,你们投资路上的"第一桶金"主要是通过什么方式积累起来的?是老老实实 打工储蓄,还是抓住了某个机遇?你觉得积累本金和追求收益率,哪个对你来说更难? 欢迎分享你的经历或观察!(敏感部分可以模糊处理,主要想了解大致的路径)。 lance77 @钝刀出鞘 从大西北闯荡上海滩,靠牛马打工攒本金,住的农民自建房,夏天一个吊扇,冬季一个电热 毯死扛,石棉瓦的房顶,夏季爆热,冬季爆冷,上班自带饭 但仔细想想,投资最难的部分,恐怕不是那4%的收益,而是攒够能产生这4%收益的"第一桶 金"本金吧? 本金积累的过程,对大多数人来说,漫长且充满挑战。可能是: 多年打工辛苦攒下的工资? 创业成功的一次性收获? 不戒 现在送外卖继续增加本金 非常有同感。作为过来人,奉劝一句,千万要稳健投资,保住本金的基础上再追求收益。 对于普 通人来说,当然最可能的原因就是打工攒的。要不为啥集思路里的大佬一个个都抠抠搜搜的,习 惯了 ...
2 万程序员签名!Node.js 之父炮轰 Oracle,这事对行业有重大影响。网友直呼:它就是寄生虫
程序员的那些事· 2025-06-29 11:31
大家好,我是小程程 2025 年 6 月 27 日,Node.js 之父 Ryan Dahl 发布了起诉甲骨文 JavaScript 商标战的最新进展。 一、最新进展 // 以下第一人称基于是 Ryan Dahl 的视角 6 月 18 日,商标审判和上诉委员会(TTAB)驳回了我们对甲骨文公司的欺诈指控。我们对此裁决持不同意见。 该指控称,甲骨文在 2019 年商标续展时,故意向美国专利商标局(USPTO)提交 Node.js 网站截图,以证明 JavaScript 商标的使用情况。 作为 Node.js 的创造者,我对此深感愤慨。Node.js 从未属于甲骨文的产品或品牌,甲骨文既非其开发者,也不负责运营,更无权利用它来支撑自身商 标。他们选择引用第三方开源网站的行为,恰恰表明其缺乏更有力的证据,且对此心知肚明。 但 欺诈指控 并非本案的核心。我们不会修改这一欺诈指控,若这么做,案件将拖延数月。我们的重点在于更关键的主张: 通用性 和 放弃使用 。 如今,所有人都用 JavaScript 来指代一种编程语言,而非某个品牌或甲骨文的产品,它是全球一种流行的编程语言而已。 案件目前正加速推进。 8 月 7 日, ...
专家热议数智金融助力高质量发展——清华五道口在第14届广州金交会上成功举办主旨会议
清华金融评论· 2025-06-29 10:35
图为张伟 主旨演讲 欧阳卫民:数智金融为科创企业添砖加瓦 欧阳卫民表示,近年来,数智金融得到了快速发展并极大提升了金融服务实体经济的品质和 能力。从企业类型看,国内顶级科创企业有央企,有地方国企,也有很多民营企业。数智金 融精准支持科创企业:一是数智信贷贷到企业的心坎上,满足企业需求,提供适配的金融产 品和服务;二是数智服务利用大数据等手段,为企业提供多元质押贷款等,扩大互信,让银 行敢作敢为;三是数智资本让融资不再拐弯抹角,拓宽融资渠道,强化资本市场功能,提高 直接融资比重和适配性。 2025年6月27日,清华大学五道口金融学院受邀在第14届中国(广州)国际金融交易·博览会上举办 主旨会议。会议以"新产业、新技术、新模式、新动能——数智金融助力高质量发展"为主题,为期1 天,设置主旨演讲、高端对话、主题发言和圆桌交流环节。多位来自金融、保险、法律与健康产业 领域的顶尖学者和资深从业者,围绕普惠金融发展、数智化金融创新、产业并购机遇及健康险生态 合作等话题进行了深入交流。会议由广东卫视主持人吴荻主持。 图为会议现场 会议由清华大学五道口金融学院党委委员、院长助理,《清华金融评论》执行主编 张伟 代表主办方 致 ...
AI正在淘汰“中间层”!昆仑万维方汉:要么冲进前10%,要么学会“向下兼容”
AI前线· 2025-06-29 06:09
采访 | 霍太稳 编辑 | Tina 过去一年,全球科技巨头都把宝押在了 AI 上。像 Meta、微软、亚马逊、谷歌 这些大公司,今年光是在 AI 基础设施上就打算砸 3,250 亿美元,秉持"先 烧钱、后吃肉"的战略,推动大模型技术快速发展。在这一波浪潮中,DeepSeek 等企业在大模型上的创新,更是把各路玩家卷得不行,甚至逼得 OpenAI 都打起了价格战。 面对全球激烈的竞争态势,中国企业不仅没有被拉开差距,反而在多个 AI 领域实现了反超,尤其是一批敢于投入并抢先布局的企业正迅速崛起。以昆仑 万维为例,他们始终紧抓行业风口,业务已覆盖全球 100 多个国家和地区。从早期的音乐社交平台 StarMaker,到成功收购全球互联网巨头 Opera,再 到现象级 AI 音乐产品 Mureka,昆仑万维的布局广泛且有前瞻性。 到了 2025 年第一季度,昆仑万维的总营收达到了 17.6 亿元,同比猛增了 46%,其中 94% 的收入都来自海外。旗下 AI 音乐业务年化流水约 1,200 万 美元,单月流水突破 100 万美元。另外,短剧平台 Dramawave 的 ARR 更是高达 1.2 亿美元。昆仑万维的 ...