多模态模型

Search documents
智谱获10亿战略投资 商业化之路仍待开启
Zhong Guo Jing Ying Bao· 2025-07-09 13:23
中经记者 李昆昆 李正豪 北京报道 近日,在智谱开放平台产业生态大会上,浦东创投集团和张江集团宣布对智谱进行总额10亿元的战略投 资,并于近期完成首笔交割。 智谱CEO张鹏透露智谱两则信息:一是开源发布新一代通用视觉语言模型GLM-4.1V-Thinking,以推理 能力为核心突破点,刷新10B级别多模态模型性能上限;二是MaaS全新上线Agent聚合平台"应用空 间",全面激活行业场景中的AI能力,联动Z基金启动Agent开拓者数亿元专项扶持计划。 关于公司经营及发展战略等问题,《中国经营报》记者采访智谱方面,截至发稿,对方尚未回复。 谈及智谱AI的经营情况,爱分析首席分析师李喆告诉记者,受到DeepSeek这些开源大模型影响,智谱 AI业绩情况可能不达预期。我们了解到情况是,2025年年初整个智谱公司经营策略,从"卖模型"向"卖 服务"方向进行调整。一方面是2024年签订的模型项目怎么跟客户解释并完成交付履约工作,另一方面 是2025年新签订项目大部分是模型应用开发类,项目交付压力会比较大。 "瓶颈主要是算力资源利用率低,商业化缺少优势。"李喆说,智谱定位是基础大模型公司,不像其他做 基础大模型的公司(阿 ...
“反击”马斯克,奥特曼说OpenAI有“好得多”的自动驾驶技术
3 6 Ke· 2025-07-07 00:32
OpenAI的CEO山姆·奥特曼和特斯拉CEO马斯克的矛盾,已经是硅谷热门的八卦。 两人都是OpenAI的联合创始人,但是奥特曼将OpenAI转向商业化运营之后,马斯克指责其背离初心,并起诉他违背创始协议。另外,马斯克还成立xAI, 和OpenAI直接竞争。 奥特曼也奋起反击,公布邮件显示,马斯克试图掌控OpenAI,遭到拒绝后才不断阻挠。 奥特曼可能还酝酿了一个"以其之道还施彼身"的反击举措,那就是研发自动驾驶,和特斯拉FSD竞争。 最近,奥特曼在做客了自己兄弟杰克·奥特曼的脱口秀,不知是否和兄弟聊天说漏了嘴。 根据纽约时报旗下DealBook的消息,该技术尚处于早期阶段,商业化也还要很远。 他说: 我想我们有一些新技术,可以为普通汽车提供自动驾驶,而且比当前技术要好得多。 I think we have some new technology thatcould just do self-driving for standard carsway better than any current approach has worked. 这里说比"当前技术""好得多",当然也包括马斯克的FSD。 不过,奥特曼 ...
百度文心大模型4.5系列模型开源,国内首发平台GitCode现已开放下载!
Cai Fu Zai Xian· 2025-06-30 07:40
6月30日,百度文心大模型4.5系列模型正式开源,并在国内领先的开源平台GitCode首发上线,为广大 企业、开发者提供真正可用、好用、可落地的大模型解决方案。 现在,全球开发者、企业、研究机构等均可免费在GitCode平台直接访问并下载体验文心大模型4.5开源 系列,支持部署、微调等各种不同场景的使用需求。 欢迎下载体验,开启你的文心大模型之旅 文心4.5系列模型均使用飞桨深度学习框架进行高效训练、推理和部署。在大语言模型的预训练中,模 型FLOPs利用率(MFU)达到47%。实验结果显示,该系列模型在多个文本和多模态基准测试中达到 SOTA水平,在指令遵循、世界知识记忆、视觉理解和多模态推理任务上效果尤为突出。模型权重按照 Apache 2.0协议开源,支持开展学术研究和产业应用。此外,基于飞桨提供开源的产业级开发套件,广 泛兼容多种芯片,降低后训练和部署门槛。 GitCode平台:开源创新的理想土壤 GitCode平台自2023年9月22日上线以来发展迅猛,已汇聚了超过620万的注册用户,月活用户达120万, 已经成为颇具影响力的开源社区,庞大的用户基础和活跃的社区氛围为文心大模型的推广和应用提供了 广 ...
百度文心大模型4.5系列正式开源,同步开放API服务
量子位· 2025-06-30 04:39
鹭羽 整理自 凹非寺 量子位 | 公众号 QbitAI 百度文心大模型开源,如期而至。 就在今天,百度官宣文心大模型4.5系列正式开源,还同步提供API服务。 此番,百度一次性推出10款开源模型,涵盖从 47B 参数的混合专家 (MoE) 模型到轻量级 0.3B 稠密型模型,覆盖文本、多模态等多种任 务需求。 此次开源不仅权重与代码完全开放,还同步提供 API服务 ,开发者可通过飞桨星河社区、HuggingFace、百度智能云千帆平台直接下载使 用。 △ 文心大模型4.5系列开源模型 值得关注的是,文心大模型4.5开源系列遵照的是 Apache 2.0协议 。 10款模型同步开源 此次百度一次性推出10款文心大模型4.5系列开源模型,在独立自研模型数量占比、模型类型数量、参数丰富度、开源宽松度与可靠性等关键 维度上,都拿出了诚意。 文心大模型4.5开源系列,还针对MoE架构提出了一种创新性的 多模态异构模型结构 。 该结构适用于从大语言模型向多模态模型的持续预训练范式,在保持甚至提升文本任务性能的基础上,显著增强了多模态理解能力,其优越的 性能主要得益于多模态混合专家模型预训练、高效训练推理框架和针对模态的后 ...
老黄亲自挖来两名清华天才;字节 Seed 机器人业务招一号位;清华北大浙大中科大校友跳槽去Meta | AI周报
AI前线· 2025-06-29 06:09
整理 | 傅宇琪、褚杏娟 引言:黄仁勋亲自招募清华"天才少年"加入英伟达;OpenAI 员工:GPT-5 将于 7 月上线,疑似完全 多模态;苹果与谷歌 DeepSeek 应用在德国被要求下架,R2 再延期;字节 Seed 多个机器人相关业 务招一号位,成立独立公司;OpenAI 华人 AI 大牛集体跳槽 Meta,清华北大浙大中科大校友各一 位;拒绝 Meta 重金挖角,特斯拉 AI 工程师:"再多的钱也无法让我离开 Elon";马斯克公布脑机接口 重大进展;宇树科技王兴兴:公司目前员工约一千人,年度营收超十亿元;小米回应"前总监冯某传 言":系食堂切菜工,旷工被开除…… 行业热点 黄仁勋亲自招募清华"天才少年"加入英伟达 6 月 28 日,英伟达创始人兼 CEO 黄仁勋近日亲自招募两位华人 AI 大牛加入英伟达。其中,朱邦华 将担任首席研究科学家,加入英伟达的 Star Nemotron 团队,负责应用研究。焦剑涛的具体岗位尚 未透露。 这两位学者本科均毕业于清华大学,朱邦华曾是华盛顿大学电子与计算机工程系助理教授,焦剑涛则 是加州大学伯克利分校电子工程与计算机科学系教授。2023 年,二人联合创办了生成 ...
拯救P图废柴,阿里上新多模态模型Qwen-VLo!人人免费可玩
量子位· 2025-06-28 04:42
前者无需多言,它现在也能像"连续剧"一样生成各种精准符合指令的图片: 一水 衡宇 发自 凹非寺 量子位 | 公众号 QbitAI 一上手就令网友直呼「生图能力」比GPT-4o更强?! 就在昨夜,阿里带着全新 多模态模型Qwen-VLo 开启炸场模式。 据介绍,Qwen-VLo在阿里原有的多模态理解和生成能力上进行了全面升级,具备三大亮点: 而且无论是输入端还是输出端,Qwen-VLo都 支持任意分辨率和长宽比,不受固定格式的限制 。 同时在官方释出的demo中,除了那些GPT-4o已经有的玩法 (如连续生成、吉卜力风格、添加文字) ,它还支持一些脑洞大开的idea。 至于后者,比如我们像在超市选购日用品一样,让Qwen-VLo生成一张 "洗浴用品都在购物篮里" 的图片。 结果啪的一下,还真立马完成装货了(⊙ˍ⊙): 不是没有一些小瑕疵,但有一说一,其 "理解"能力 确实比之前更强。 官方介绍,这种理解能力不止体现在图像生成上,还包括对图像的识别解释。 具有增强的 细节捕捉能力 ,能在整个生成过程中保持高度语义一致性; 一个指令即可实现图像编辑,包括风格替换、素材增删、添加文字等等; 支持中英等多语言,全球用户 ...
小米MiMo-VL VS 千问Qwen2.5-VL | 多模态模型实测
理想TOP2· 2025-06-18 11:43
Core Viewpoint - The article discusses the performance of Xiaomi's MiMo-VL-7B multi-modal model, highlighting its strengths and weaknesses compared to the Qwen2.5-VL model, particularly in various testing scenarios. Group 1 - MiMo-VL-7B model outperforms several multi-modal understanding models, especially Qwen2.5-VL, in various tests [3][5]. - The testing results indicate that the SFT (Supervised Fine-Tuning) and RL (Reinforcement Learning) versions of MiMo-VL-7B show similar performance, while the "think" version significantly outperforms the "no-think" version [5][6]. - MiMo-VL-7B's performance in recognizing handwritten OCR is noted to be poor [5][9]. Group 2 - In table recognition tasks, MiMo-VL-7B's "think" model performs well, while the "no-think" model and Qwen2.5-VL struggle [9][10]. - For medium complexity tables, MiMo-VL-7B-SFT "think" model approaches correctness, while other models fail [18][19]. - The article emphasizes that MiMo-VL-7B-SFT "think" model shows better results in complex table recognition compared to its counterparts [26][27]. Group 3 - The article concludes that Xiaomi's MiMo-VL model is impressive overall, particularly the "think" model, which excels in most capabilities except for handwritten OCR [67][68]. - Despite its strengths, the article suggests that the claims of MiMo-VL-7B significantly outperforming the 72B model may be exaggerated [68].
证券研究报告行业周报:2025年暑期档在即,字节发布豆包大模型1.6-20250615
GOLDEN SUN SECURITIES· 2025-06-15 07:53
证券研究报告 | 行业周报 gszqdatemark 2025 06 15 年 月 日 传媒 分析师 刘书含 2025 年暑期档在即,字节发布豆包大模型 1.6 行情概览:本周(6.9-6.13)中信一级传媒板块上涨 1.38%。本周传媒板 块在新消费等主题带动下上涨。2025 年传媒弹性方向看好 AI 应用、IP 变现 及并购重组,AI 应用聚焦新应用的映射投资及部分较成熟应用的数据跟踪, 重点关注多模态产业方向。IP 变现聚焦有 IP 优势及全产业链潜力的公司,潮 流玩具、影视内容等方向有机会。并购重组重点关注国企方向,在国资委明 确国企市值考核的背景下,传媒国企诉求明显提升,部分国企资金优势明显。 板块观点与关注标的:1)资源整合预期:中视传媒、国新文化、广西广电、 唐德影视、吉视传媒、游族网络等;2)AI:荣信文化、奥飞娱乐、汤姆猫、 盛天网络、中文在线、易点天下、视觉中国、盛通股份、焦点科技、豆神教 育、世纪天鸿、佳发教育等;3)游戏:建议关注确定性强的神州泰岳、恺英 网络、巨人网络、吉比特,关注完美世界、ST 华通、冰川网络、华立科技;4) 国企:慈文传媒、皖新传媒、中文传媒、南方传媒、凯文教育、 ...
火山引擎原动力大会即将召开,恒生互联网ETF(159688)大涨超3.7%,恒生科技ETF指数基金(513580)涨超2.8%
2 1 Shi Ji Jing Ji Bao Dao· 2025-06-09 02:58
6月9日,港股高开高走,恒生指数涨超1%,恒生科技指数涨幅扩大至2.33%。相关ETF方面,截至发 稿,恒生科技ETF指数基金((513580)盘中涨幅达2.82%,持仓股方面,金蝶国际涨超6%,腾讯音乐- SW、美团-W、京东集团-SW等纷纷大涨。与此同时,恒生互联网ETF(159688)大涨3.77%。 中信建投指出,近期多模态动态更新密集。5月21日,谷歌于2025 I/O大会上正式推出 Veo 3 视频生成模 型,实现AI视频音画同步;5月23日,豆包正式上线视频通话功能,支持实时视频交流及屏幕分享;6 月6日,快手宣布可灵AI ARR在2025年3月突破1亿美金,且4月和5月的月度付费金额均突破1亿人民 币。考虑到6月10日苹果WWDC 2025及6月11日字节Force 2025原动力大会·春即将召开,多模态模型和 端侧AI产品有望加速落地。 天风证券指出,6月,以稳应变,防守反击。根据经济复苏与市场流动性,可以把投资主线降维为三个 方向:1)Deepseek突破与开源引领的科技AI+,2)消费股的估值修复和消费分层逐步复苏,3)低估 红利继续崛起。红利回撤常在有强势产业趋势出现的时候,因此低估红 ...
中信建投 TMT周观点
2025-06-30 01:02
中信建投 TMT 周观点 20250608 摘要 微软 AI 应用收入预计 2025 财年接近 120 亿美元,Copilot 业务贡献 20 亿美元,GitHub 贡献 6 亿美元,均超预期。Salesforce 的 Einstein Automate 营收超 1 亿美元,略低于预期,Data Cloud 营收 10 亿美元,同比增长 120%。 Snowflake 营收同比增长 26%,利润增长 25%,上调全年预期,得益 于数据云需求强劲,RPO 同比增长 34%,新增高价值客户 606 家。推 出 Near Intelligence、OpenFlow 和 Cortex 新型 AI Circle 功能,巩 固其在数据云领域的领先地位。 数据云和数据层面布局加深,Snowflake、Elasticsearch 和 MongoDB 等公司持续投资。AI 基础设施重要性提升,数据咨询和数据 标签订单加速增长。MongoDB、Solr 和 Elasticsearch 排序较高, Applovin、ServiceNow 和 Salesforce 表现稳定。 苹果 WWDC 2025 大会预计展示新技术与产品更新, ...