Workflow
多模态模型
icon
Search documents
AI应用投资机会梳理
2026-01-13 01:10
摘要 AI 应用投资机会梳理 20260112 AI 应用边际改善显著,大语言模型迭代加速,2025 年已达季度级别, 谷歌 Gemini、Anthropic 和 OpenAI 等头部实验室竞争激烈,模型性 能通过范式革新实现脉冲式提升,在线学习或终身学习成为新方向。 多模态模型发展潜力巨大,目前处于早期阶段,但未来有望实现跨越式 发展。OpenAI 的周活跃用户(WAU)已接近 10 亿,预计 2026 年底 可能达到 20 亿,AI 已成为全球流量格局中不可忽视的一部分。 国内外用户付费习惯差异影响国内 AI 应用市场,海外 C 端订阅模式在国 内推广受阻,B 端收费亦存在困难。教育等增值服务领域仍有机会实现 收入增长,AI 成果显著的公司将获得更多关注。 港股阿里巴巴、快手、美图和富博等公司在 AI 应用方面领先,值得关注。 阿里巴巴积极布局 AI 优化供应链和客户体验;快手利用 AI 改进内容推 荐;美图通过 AI 提升图像处理功能;富博在特定领域拥有先进 AI 技术。 OpenAI 大幅上修 2026-2029 年营收预期,探索电商和广告变现免费 用户,计划 2026 年实现 30 亿美元的免费用户 ...
2025,AI行业发生了什么?
经济观察报· 2026-01-12 11:48
2025年的帷幕已经落下,这一年中,AI行业无疑走过了极具里程碑意义的一程。从技术范式的革 新,到商业逻辑的重构,从产业应用的落地,到全球规则的博弈,这一年既有突破,也留下诸多思 考。 以下文章来源于经济观察报观察家 ,作者经观观察家 经济观察报观察家 . 理性,建设性 AI已经进入"下半场"。技术边界不再只是把模型做得更大、更 久,而是重新定义问题、重塑评估方式、判断未来路径。越来 越多的企业意识到,AI的核心从"解决问题"转向"提出什么问 题、如何衡量进步",而这种能力往往出现在长期浸泡在一线 研究中的年轻技术派身上。 作者:陈永伟 封图:图虫创意 鉴于AI发展错综复杂,这里只能从十个侧面做一个简要回顾。 在设计原生多模态模型的过程中,很多人逐渐意识到:多模态模型的真正瓶颈,并不在于它能不能 看图、听声音,而在于能否把视觉、语言、时间与空间组织成一个可推理、可行动的统一表征。现 在的大模型在语言上已经高度成熟,却依然缺乏对三维空间、物理约束和因果关系的系统理解。因 此,下一代AI的突破重点,可能并不在于再多几个参数,而在于能否构建对真实世界的内部模型, 使其可以在脑中"预演"行动后果。在这种思路之下,"世 ...
粤开市场日报-20260112
Yuekai Securities· 2026-01-12 07:38
证券研究报告 | 策略点评 2026 年 01 月 12 日 投资要点 分析师:孟之绪 执业编号:S0300524080001 电话: 邮箱:mengzhixu@ykzq.com 投资策略研究 粤开市场日报-20260112 今日关注 指数涨跌情况:今日 A 股主要指数全数上涨。截止收盘,沪指涨 1.09%,收报 4165.29 点;深证成指涨 1.75%,收报 14366.91 点;科创 50 涨 2.43%,收报 1511.84 点;创业板指涨 1.82%,收报 3388.34 点。总体上,全天个股涨多跌 少,Wind 数据显示,全市场 4141 只个股上涨,1179 只个股下跌,144 只个股 收平。沪深两市今日成交额合计 36014 亿元,较上个交易日放量 4787 亿元。 行业涨跌情况:今日申万一级行业涨多跌少,传媒、计算机、国防军工、社 会服务和通信等行业领涨,涨幅分别为 7.80%、7.26%、5.66%、3.21%和 2.74%, 石油石化、煤炭和房地产行业下跌,跌幅分别为 1.00%、0.47%和 0.29%。 板块涨跌情况:今日涨幅居前概念板块为 Kimi、拼多多合作商、小红书平台、 卫星 ...
智谱唐杰:2025年可能是多模态模型的适应年
Xin Lang Cai Jing· 2026-01-10 09:08
每经记者|可杨 每经编辑|陈俊杰 每经北京1月10日电(记者可杨),今日,清华大学教授、智谱创始人唐杰在AGI-Next 前沿峰会上表 示,2025年可能是多模态模型的失意年,很多多模态模型没有引起较多关注,更多的还在做文本智能上 限的提升。唐杰表示,对于大模型来讲,怎么把多模态的信息收集并且统一感知,也就是实现原生多模 态模型,还是一个短板。"后来我想的是,原生多模态模型和人的感统其实很相似。人的感统是收集到 一些视觉信息、声音信息,还收集了一些触觉的信息,怎么把这些信息统合到一起、感知一个东西?其 实人很多时候大脑会有些问题,很多时候是感统不协调,就是感统失调。对于模型来讲,下一个功能就 是在这方面来推进。" ...
粤开市场日报-20260109-20260109
Yuekai Securities· 2026-01-09 07:48
证券研究报告 | 策略点评 2026 年 01 月 09 日 投资要点 分析师:孟之绪 执业编号:S0300524080001 电话: 邮箱:mengzhixu@ykzq.com 投资策略研究 粤开市场日报-20260109 今日关注 指数涨跌情况:今日 A 股主要指数普遍上涨。截止收盘,沪指上涨 0.92%,收 报 4120.43 点;深证成指涨 1.15%,收报 14120.15 点;创业板指涨 0.77%, 收报 3327.81;科创 50 指数涨 1.43%,收报 1475.97 点。总体上,全天个股 涨多跌少,Wind 数据显示,全市场 3918 只个股上涨,1344 只个股下跌,201 只个股收平。沪深两市今日成交额合计 31227 亿元,较上个交易日放量 3224 亿元。 行业涨跌情况:今日申万一级行业涨多跌少,传媒、综合、国防军工、计算 机、有色金属等行业领涨,涨幅分别为 5.31%、3.60%、3.29%、2.90%、2.78%, 银行、非银金融行业下跌,跌幅分别为 0.44%、0.20%。 概念板块涨跌情况:今日涨幅居前的概念板块为拼多多合作商、小红书平台、 Kimi、抖音豆包、WEB3. ...
垂类AI应用专题:Minimax是全球化大模型公司,拥有大语言、视频、音频大模型
Guoxin Securities· 2026-01-05 14:54
Investment Rating - The investment rating for the industry report is "Outperform the Market" (maintained) [1] Core Insights - MiniMax is a global large model company that has served over 200 countries and regions, with more than 200 million individual users and over 100,000 enterprise clients. The company's overseas revenue accounts for 73%, with significant contributions from Singapore and the United States [2][4] - The company has a strong focus on AI applications, particularly in video and audio, positioning itself in the first tier globally. MiniMax has launched the first MoE (Mixture of Experts) large model in China and is prioritizing multimodal integration in its strategy [2][3] - MiniMax's revenue has seen significant growth, with a 175% year-on-year increase in revenue for the first nine months of 2025, driven primarily by its AI video and open platform products [2][20] Summary by Sections Company Overview - MiniMax was established at the end of 2021 and has rapidly expanded its services globally, leveraging technology innovation, efficient operations, and a global strategy [6][14] - The company has a diverse product portfolio, including AI video generation (Hailuo AI), AI companionship (Talkie), and an open platform for API services, which contribute significantly to its revenue [15][20] Financial Performance - In 2024, MiniMax's revenue was $30.52 million, and in the first nine months of 2025, it reached $53.44 million, marking a 175% increase year-on-year. The revenue contributions from the open platform, Hailuo AI, and Talkie are 29%, 33%, and 35%, respectively [20] - The gross margin turned positive in 2024, and by the first nine months of 2025, it reached 23%, with a significant reduction in net losses from $244.24 million in 2024 to $186.28 million in 2025 [20][17] Market Position - MiniMax ranks as the fourth largest pure-play large model technology company globally, with a market share of 0.3% based on 2024 revenue. The company is the only Chinese startup in the top ten [42][46] - The global large model market is projected to grow significantly, with expectations of reaching $220 billion by 2025, indicating a strong potential for MiniMax's growth in this sector [41] Product and Technology - MiniMax's AI products, particularly in video and audio, are recognized for their high performance and cost-effectiveness. The Hailuo AI video generation platform is noted for its dual-mode capabilities, enhancing its application across various scenarios [56][57] - The Speech-02 model is highlighted for its low latency and high-quality audio generation, ranking second globally in the voice model category [59][60]
华为开源7B多模态模型,视觉定位和OCR能力出色,你的昇腾端侧“新甜点”来了
量子位· 2026-01-05 05:00
允中 发自 凹非寺 量子位 | 公众号 QbitAI 7B量级模型,向来是端侧部署与个人开发者的心头好。 轻量化特性让它能灵活适配各类终端场景,而强劲性能又能覆盖图像信息抽取、文档理解、视频解析、物体定位等高频需求。 刚刚,华为重磅推出 开源新玩家openPangu-VL-7B ,直接瞄准这一核心场景精准发力。 昇腾原生的模型结构,让openPangu-VL-7B的推理性能极具性价比: 720P图像在单张Ascend Atlas 800T A2卡上 首字模型推理时延 (ViT与LLM模型时延和) 仅160毫秒 ,能够进行5FPS的实时推理; 训练 阶段的MFU更是达到42.5% 。 更值得关注的是,模型 在预训练阶段完成了3T+tokens的无突刺集群长稳训练 ,为开发者使用昇腾集群提供了极具价值的实践参考。 官方提供的cookbook也展现了模型在这些领域的优异能力。 比如我们给模型一张菜品图,让模型找到一共有多少个樱桃番茄,模型能够点出所有的位置并正确计数。 给模型一张年报截图,模型也能将其转变为markdown格式,省去了人工摘录的痛苦。 | (人民币百万元) 2024年 2023年 同比变动 | | ...
DeepSeek元旦发布新论文,开启架构新篇章;安克创新回应“裁员30%”;陈天桥再押注,中国首家超声波脑机接口公司成立丨邦早报
创业邦· 2026-01-02 01:09
Group 1 - Gestala, China's first ultrasound brain-computer interface company, was officially established, focusing on innovative technology for brain signal reading and analysis [3] - Ideal Auto delivered 44,246 vehicles in December 2025, with a total of 1,540,215 vehicles delivered since inception [4] - NIO delivered 48,135 vehicles in December 2025, a year-on-year increase of 54.6%, with total deliveries for the year reaching 326,028 vehicles, up 46.9% [4] Group 2 - Xpeng Motors delivered 37,508 vehicles in December 2025, a 2% year-on-year increase, with total deliveries for the year at 429,445 vehicles, up 126% [4] - Zeekr delivered 30,267 vehicles in December 2025, a historical high, with total annual deliveries of 224,133 vehicles [5] - Leap Motor achieved 60,423 vehicle deliveries in December 2025, a 42% year-on-year increase, with total annual deliveries of 596,555 vehicles, up 103% [5] Group 3 - DeepSeek published a new paper introducing a new architecture called mHC, aimed at addressing instability in large-scale model training while maintaining performance gains [4] - Anker Innovation responded to rumors of a 30% layoff, stating that the adjustments were part of a normal personnel restructuring for strategic upgrades [9] - Neuralink plans to start mass production of brain-computer interface devices in 2026, transitioning to a streamlined, nearly fully automated surgical process [10][12] Group 4 - The Chinese film box office for 2025 reached 51.832 billion yuan, a year-on-year increase of 21.95%, with domestic films accounting for 79.67% of the total [27] - The box office for the 2026 New Year's Day period surpassed 300 million yuan, with "Zootopia 2," "Avatar 3," and "Killing" leading the box office [29] - ListenHub's parent company MarsWave completed a $2 million funding round, with an annual recurring revenue (ARR) exceeding $3 million [23]
2026年五大猜想:入口争夺大年
GOLDEN SUN SECURITIES· 2025-12-31 13:32
证券研究报告 | 行业策略 gszqdatemark 2025 12 31 年 月 日 海外市场 2026 年五大猜想:入口争夺大年 猜想一:模型能力有望持续突破。展望未来,我们认为 AI 模型能力仍处于持续进 化通道,2026 年有望在加强多模态推理与生成能力、提升超长上下文处理能力及 降低模型幻觉率等维度上取得突破。在应用场景方面,这有望促进内容产业工业 化、世界模型演进,也有望加速智能体迭代、及支撑 AI 向更专业的行业级与科研 级应用延伸。 猜想二:AI 应用进入流量入口争夺大年。1)在 C 端入口的争夺上,头部互联网 厂商如阿里巴巴、字节跳动、腾讯等凭借领先的模型能力与丰富的业务生态,具备 先发优势。2)B 端应用方面,AI Coding、AI 营销、AI4S 有望成为率先突围的领 域。我们预计 2026 年,C 端入口的争夺会演化为软硬结合与生态丰富度的竞争, 而 B 端应用的渗透率会随着模型多模态、上下文处理、幻觉率优化等能力的提升 而持续加速。 猜想三:端侧智能硬件迎来安卓时刻。展望 2026,我们认为,端侧硬件中,1)手 机和 PC 市场或因存储成本上涨而带来终端销量承压,但折叠机等创新点仍 ...
从谷歌AI体系看应用叙事
2025-12-29 01:04
从谷歌 AI 体系看应用叙事 20251228 摘要 Gemini 3.0 Pro 在多模态数据处理上超越 GPT 5.1 和 Claude 4.5,支 持文本、图片、音频、视频及 PDF,上下文窗口达 100 万 token,提升 复杂问题推理和资源动态调整能力,实现更拟人的慢思考效果。 谷歌视频生成模型 VO 系列,特别是 VO 3.0 和 VO 3.1,实现了音画同 步直出和视频精确调控,单价与 Sora R 接近,分辨率达 720P- 1,080P,并通过技术架构在视频生成领域保持领先,满足用户精细化控 制需求。 截至 2025 年 10 月,谷歌 Gemini 单用户单次使用时长超越 ChatGPT,达 7.2 分钟,得益于嵌入谷歌应用生态系统,下载量增长迅 速,从年中 1,500 万次增至 6,600 万次,有效扩大用户群体并提高用户 粘性。 NanoBanana 是基于 Gemini 开发的图像生成模型,通过调用谷歌搜索 接入真实世界知识,并执行思考步骤理解提示词情境,具备高分辨率、 文字渲染准确、图片精细操控及实时接入知识等优势。 Q&A 谷歌最新发布的核心旗舰模型 Gemini 3.0 Pr ...