绘想

Search documents
百度自研的视频生成模型还是来了
Xin Lang Cai Jing· 2025-07-04 01:39
智通财经记者 | 肖芳 一位百度内部人士也向智通财经解释称,去年李彦宏在内部讲话中还提到,基于多模态的需求,可以做一些相对特定的 视频生成场景。百度前段时间发布的罗永浩数字人以及此次发布的视频生成模型都是基于特定场景和特定需求的,这是 百度内部一直在探索的。 目前,市场上大多数视频生成模型都是技术驱动型,即通过不断优化算法、增加算力、丰富数据等技术手段,提升模型 性能和生成视频的质量,以满足用户需求和市场竞争,但模型并没有确定性的应用场景,而是随着模型能力的提升进行 持续探索。相比之下,百度视频生成模型最大的不同就是商业驱动,即先有了明确的商业需求,再结合需求研发模型。 百度商业体系商业研发总经理刘林向界面新闻透露,MuseSteamer项目在今年春节之后才开始立项,研发团队有几十个 人,到上线有效的研发时间只有3个月。 刘林表示,MuseSteamer之所以能够在较短时间上线,是因为其在技术上并不是完全从零起步。擎舵平台在多模态生成 上本身就有了一定的技术积累,百度商业体系在模型训练框架推理、卡片调优上也有一些积累,能够快速的延续过来。 智通财经编辑 | 文姝琪 在百度AI DAY科技开放日上,百度移动生态 ...
AI与机器人盘前速递丨百度发布AI视频生成模型MuseSteamer,CMG 世界机器人技能大赛本周日开赛!
Mei Ri Jing Ji Xin Wen· 2025-07-04 01:34
【市场复盘】 1.7月2日,百度发布自研视频生成模型"MuseSteamer"及配套平台"绘想",正式进军AI视频生成领域。 百度强调MuseSteamer的极致遵循力和镜头运用能力,旨在降低专业创作门槛。此前,李彦宏曾表示不 做通用视频生成模型,但特定场景下有需求。MuseSteamer或主要应用于广告创意生成与内容投放。同 日,百度搜索宣布十年来最大改版,接入MuseSteamer。 2.7月3日,CoreWeave公司在官网宣布,已经收到了市场上首个基于英伟达最新的人工智能服务器系 统。服务器组装商戴尔科技在官网上发布了新闻稿,英伟达也在社交媒体上确认了这一里程碑。 3.7月6日(本周日)上午10点30分,CMG世界机器人技能大赛首场机器狗任务赛直播开启,机器狗"黑 豹2.0"将在直播间,挑战三大"不可能任务",上演"百米人机对决"。 周二(2025年7月3日),截至收盘,科创人工智能ETF华夏(589010)收平,持仓股方面涨跌互现,道 通科技领涨5.50%,澜起科技跟涨2.54%,芯原股份领跌5.13%,奥比中光跟跌4.82%;机器人ETF (562500)收涨0.48%,持仓股方面,燕麦科技领涨5 ...
互联网大厂做AI都这么拼了吗?
佩妮Penny的世界· 2025-07-03 10:44
大家好,我是佩妮。 1)搜索是未来 AI 最大,也最重要的场景和入口。 不知道有多少朋友和我一样,习惯性上网第一步,都会在浏览器中自然地敲出 "baidu" 的网址。(比如测一测网连上了没 hhh) 百度花了25年的时间,在中文用户心智中建立了 "百度"等于"搜索" ,日均搜索次数达到数十亿次。 搜索几乎是 AI 时代确定性的最重要场景,目前在一级市场最热门的 AI项目,也有很多是在 搜索,浏览器 和 通用 Agent 领域; 在AI时代来临之前,传统搜索引擎的商业模式高度依赖在线营销服务,即 广告收入 。 营收占比一半以上,妥妥的 现金牛 业务。我看了下 Google 的财报,搜索贡献收入占比和百度也差不多。 搜索其实是这一波新的AI 技术变革的发源地,因其技术储备接近。 准确理解用户的意图,从海量数据和语料中查询,检索,判断,推荐,持续优化,这本来就是搜索做的事情, 所以百度也是国内最早喊出"All in AI"的公司。 AI 领域的变化是我长期关注的主题,昨天是百度 2025 AI Day ,发布了不少有意思的新产品。 尤其是主营业务搜索,号称是 10 年以来最大改版, 自己革自己的命 的那种。 众所周 ...
百度正在改变百度
36氪· 2025-07-03 09:25
7月2日,百度在AI Day上正式宣布百度搜索框升级为"智能框"。在基础逻辑上,百度搜索有了更清晰的呈现:即底层(LLM+视频生成模型),中间层 (MCP+agent工具+真人服务)与上层(智能框+百看+AI助手升级)的全新生态架构。 在人们的印象中,搜索是什么样的?一个框、一句话、一个问题,你就可以从这个搜索框里得到所有的答案。 如果这个搜索框有了自己的"意志"呢? 如果"答案"已不再是简简单单的文字聚合呢? 一个多月前,Google在I/O大会上用AI全家桶炸场,其中最为关键的变化之一,就是宣布AI搜索从实验室"毕业",正式进入人们的生活。谷歌CEO Sundar Pichai在会上表示,AI模式可以使搜索长度达到传统谷歌搜索的两到三倍,有时甚至是五倍。在AI模式下,可以进行复杂的数据可视化、代理结账、AI购 物试穿…… 人们不得不感慨,AI已深刻影响每个人的生活。一个月后,百度同样默契迎来近十年来最大改版,一个全新的搜索框呈现在人们眼前。 7月2日,百度在AI Day上正式宣布百度搜索框升级为"智能框"。在基础逻辑上,百度有了更清晰的呈现:即底层(LLM+视频生成模型),中间层 (MCP+agent工具 ...
何小鹏:这五年是汽车淘汰赛最后五年|首席资讯日报
首席商业评论· 2025-07-03 03:34
1.百度发布自研视频生成模型MuseSteamer 据《科创板日报》2日讯,在百度AIDAY科技开放日现场,百度商业研发团队正式发布自研视频生成模型 MuseSteamer,及视频产品平台"绘想"。 点评:要颠覆AIGC创作流程? 2.100亿元湖北省人形机器人产业投资母基金成功设立 日前,湖北省财政厅依托省政府投资引导基金支持长江证券牵头设立的湖北省人形机器人产业投资母基 金,已完成合伙协议签署、工商注册和首期实缴出资,成为《湖北省重构政府引导基金体系工作方案》印 发后成功设立的第一只参股基金。该基金总规模100亿元,计划分两期组建,首期规模50亿元,其中:省政 府投资引导基金、武汉产业基金各认缴20%,长江证券、湖北省科投集团各认缴30%,重点投向人形机器人 和人工智能相关产业核心领域,包括湖北省重点发展的人形机器人链主企业及具有核心技术实力的零部 件、脑机接口、控制系统、模型算法等战略性、先导性的科技型企业。 3.摩根士丹利上调美国资产管理公司目标价,看好每股收益前景 6.贵州茅台:已回购338.21万股,使用资金总额52.02亿元 贵州茅台公告,公司于2024年11月27日股东大会审议通过回购股份方案 ...
资讯日报-20250703
Guoxin Securities Hongkong· 2025-07-03 02:30
国信证券(香港)·资讯日报 股票市场概览 港股市场表现 美股市场表现 | 2025 7 | 年 | 月 | 3 | 日 | | | --- | --- | --- | --- | --- | --- | | 资讯日报 | | | | | | | 海外市场主要股市上日表现 | | | | | | | | | | | | 升跌(%) | | 指数名称 | | | | 收市价 | | | | | 单日 | 年内 | | --- | --- | --- | --- | | 恒生指数 | 24,221 | 0.62 | 20.75 | | 恒生国企 | 8,725 | 0.54 | 19.68 | | 恒生科技 | 5,269 | (0.64) | 17.93 | | 美国道琼斯 | 44,484 | (0.02) | 4.56 | | 美国标普 500 | 6,227 | 0.47 | 5.88 | | 美国纳斯达克 | 20,393 | 0.94 | 5.60 | | 德国 DAX | 23,790 | 0.49 | 19.49 | | 法国 CAC | 7,738 | 0.99 | 4.85 | | 英国富时 1 ...
赛道Hyper | 百度取道特定场景攻略AGI视频
Hua Er Jie Jian Wen· 2025-07-03 00:57
作者:周源/华尔街见闻 在生成式AI技术从实验室走向产业应用的过程中,视频生成因其技术复杂度高、场景需求多元,始终 是行业攻坚的重点领域。 百度商业研发团队在7月2日推出的视频生成MuseSteamer模型及"绘想"平台,瞄准了搜索、广告和推荐 场景中原生化内容生产的实际痛点,试图通过技术适配性优化,探索AIGC视频落地的可行路径,宣告 了百度开始进军AI(人工智能)视频生成领域。 值得一提的是,2024年,Sora爆火引发生成式视频大模型热潮,百度创始人、董事长兼CEO李彦宏在一 场内部讲话中称,Sora这种视频生成模型的投入周期太长,10年、20年都可能拿不到业务收益,无论多 火爆,百度都不去做。 百度技术团队不惜"打脸"李彦宏,很可能是解决了视频生成的核心挑战——如何让视觉元素与声音信息 在时间轴上形成自然协同;另外,7月2日有消息称,李彦宏在2024年那场闭门会议上还提了一嘴:基于 多模态需求,可以做一个相对特定的视频生成场景。 MuseSteamer正是一个相对特定的视频生成模型,从这个角度看,也确实算不上打脸老板。 这个模型的技术设计,解决了聚焦于中文语境下的多模态语义对齐问题。 与英文相比,中文 ...
Sam Altman反击Meta大举挖角,直言后者“令人厌恶”;百度将发布自研视频生成模型MuseSteamer丨AIGC日报
创业邦· 2025-07-02 23:52
1.【Sam Altman反击Meta大举挖角,直言后者"令人厌恶"】据报道,OpenAI CEO Sam Altman就 Meta近期大举挖角AI人才一事展开反击。周一晚间,Altman向OpenAI研究人员发出了一份措辞强硬 的回应。回应中称:"Meta的行为方式让人感觉有些厌恶。"当日,Meta CEO扎克伯格宣布了新成 立的超级智能团队,其中包括一些来自OpenAI的人员。Altman表示:"Meta确实招到了一些优秀的 人才,但总体而言,他们没有得到最顶尖的人才。我已经记不清他们曾试图让这里的多少人成为他们 的首席科学家了。"他还在回应中表示OpenAI正在评估整个研究团队的薪酬。(第一财经) 4.【智谱发布并开源视觉语言大模型GLM-4.1V-Thinking】智谱开放平台产业生态大会在上海浦东 张江科学会堂举办。会上,浦东创投集团和张江集团联合宣布战略投资智谱。智谱今天还正式发布并 开源了视觉语言大模型GLM-4.1V-Thinking。据悉,GLM-4.1V-Thinking是一款支持图像、视 频、文档等多模态输入的通用推理型大模型,专为复杂认知任务设计。此外,智谱推出全新生态平 台"Agen ...
腾讯研究院AI速递 20250703
腾讯研究院· 2025-07-02 15:52
生成式AI 一、 从亲密伙伴抢人,Cursor挖走Claude Code两位核心人物 1. Cursor开发商Anysphere挖走Claude Code核心人物Boris Cherny和Cat Wu,尽管双方 是密切合作伙伴; 2. Anthropic年收入达40亿美元,估值615亿美元,Claude被视为最佳编程模型; 3. Anysphere收入三个月内翻倍至年收入5亿美元,估值达99亿美元,AI编程市场竞争加 剧。 https://mp.weixin.qq.com/s/xsPfOFxttF7s9bq3o-F_Iw 二、 智谱开源GLM-4.1V-Thinking视觉推理模型,10B级SOTA 1. 智谱开源GLM-4.1V-9B-Thinking模型,采用课程采样强化学习策略,在18项权威评测 中超越8倍参数的72B模型; 2. 模型架构结合ViT视觉编码器、MLP适配器和GLM语言解码器,引入2D-RoPE和3D- RoPE位置编码增强处理能力; 3. 训练过程分为多模态预训练、长上下文持续训练、监督微调和课程采样强化学习四个阶 段,显著提升逻辑推理能力。 https://mp.weixin.qq. ...
百度正在改变百度
3 6 Ke· 2025-07-02 13:38
在人们的印象中,搜索是什么样的?一个框、一句话、一个问题,你就可以从这个搜索框里得到所有的答案。 如果这个搜索框有了自己的"意志"呢? 如果"答案"已不再是简简单单的文字聚合呢? 一个多月前,Google在 I/O 大会上用AI全家桶炸场,其中最为关键的变化之一,就是宣布AI搜索从实验室"毕业",正式进 入人们的生活。谷歌CEO Sundar Pichai 在会上表示,AI 模式可以使搜索长度达到传统谷歌搜索的两到三倍,有时甚至是五 倍。在AI模式下,可以进行复杂的数据可视化、代理结账、AI购物试穿…… 人们不得不感慨,AI已深刻影响每个人的生活。一个月后,百度同样默契迎来近十年来最大改版,一个全新的搜索框呈现 在人们眼前。 7月2日,百度在AI Day上正式宣布百度搜索框升级为"智能框"。在基础逻辑上,百度有了更清晰的呈现:即底层 (LLM+视频生成模型),中间层(MCP+agent工具+真人服务)与上层(超级智能框+百看+AI助手升级)的全新生态架 构。 或许,新搜索的叙事已经开始了。 01 更大的搜索框,还是搜索吗? 从最直观的视觉呈现上,百度搜索的框真的变大了。 更为具体的说,底层有文心大模型、视频生 ...