海螺AI

Search documents
字节、讯飞、MiniMax,为什么都在上新“声音复刻”?
AI研究所· 2025-07-04 09:28
前不久,字节跳动旗下豆包 AI 播客功能全量上线的消息引发行业震动。 有用户上传 8 万字的英文 PDF 文档,系统能在数秒内生成男女对谈的播客节目,语气词、停顿节 奏与真人对话无异。 几乎同一时间, 早在 2 0 2 4 年 4 月 就推出声音复刻功能的 科大讯飞 ,则 宣布声音复刻技 术升 级,仅需不到 10 秒的音频素材,就能让《长安的荔枝》中"李善德"的声音复刻品在情绪表达上与 原角色难分伯仲。 而在稍早的 2024 年底, MiniMax 的海螺 AI 也 已凭借 30 秒语音素材克隆出唐国强、林黛玉 等 人物的声音,情感还原度让中文语音克隆实现从"能用"到"好用"的跨越。 这些技术突破背后,是科技巨头对音频内容赛道的战略押注。其核心逻辑在于:通过声音复刻、智能 生成等技术,重构音频内容的生产、分发与消费链条,试图在这片被称为"耳朵经济"的蓝海中开辟 新航道。 当 AI 不仅能复刻声音,更能模拟对话逻辑、生成结构化内容时,这场声音革命又将如何重塑内容产 业与商业版图? 01 声音复刻 +播客 的技术竞速 从豆包到讯飞,再到海螺 AI 这是一场从文档到对话的工业化生产转变。 图/豆包网页版"AI播客" ...
“AI六小虎”到了下一个赛点
3 6 Ke· 2025-07-04 09:24
作为"AI六小虎"之一的MiniMax(稀宇科技),近期刚刚结束了"技术发布周"。 自6月17日以来,MiniMax发布了一系列核心技术与产品更新,涵盖基座模型、视频生成模型、多模态智能体等多个方向,系统展现其"模型--多模态--应 用"一体化技术路线。 就在MiniMax"疯狂上新"的同时,市场上传出了其拟赴港IPO的消息,这也让MiniMax成了智谱AI之后第二家"AI六小虎"中传出冲刺上市的公司;不过, 目前公司对此没有相关回应。 图源:微博截图 即使身处时下最火的赛道、顶着明星履历,MiniMax或者其他"AI六小虎"的企业也都面临着同样的困境——产品同质化、商业化不成熟,以及盈利困境。 01.冲刺IPO的"六小虎" "AI 六小虎"(谱、月之暗面、百川智能、MiniMax、阶跃星辰、零一万物)是过去两年国内大模型时代的一个标志,指的是当年最早完成 10 亿 + 美元融 资,且均拥有自研千亿参数级大模型,在国际基准测试中与 GPT-4、Llama 等对标的大模型创业公司。 为了避免依赖单一产品的风险,2024年9月,MiniMax发布了视频生成模型"海螺视频I2V-01",并上线了海螺AI。 AIGC ...
MiniMax逆着商汤过河
Sou Hu Cai Jing· 2025-07-04 01:21
文 | 新立场Pro 25年刚过半,"AI六小虎"的称呼仿佛成为了一个过气梗,DeepSeek横空出世,改写了AI创业的造神势头——原本也许可以在新一年高歌猛进的六大玩 家,上半年有人削减投流,有人裁撤业务,有人重心转向,有人更加急切地寻求上市。 2月消息称月之暗面Kimi暂停烧钱投流;3月消息称百川智能裁撤主要负责金融行业To B业务的B端组;4月智谱向中国证监会北京证监局提交上市辅导备 案;5月零一万物转向彻底拥抱To B;6月初消息称阶跃星辰减少C端应用投入并将重心转向Agent;就在前段时间,消息称MiniMax计划最早在今年港股上 市,并且已为此次IPO聘请了财务顾问。 DeepSeek鲶鱼效应加速下,六小虎当然知道市场留给自己的耐心更加不多了,寻求上市则是赚取更多市场耐心的方式之一。 不止闫俊杰,根据公开资料,MiniMax另一位创始人周彧聪也来自商汤。所以起初,在市场对AI六小虎的模式和演变路径都还不清楚的时候,MiniMax被 视为"商汤系"、"商汤2.0",这当然不意味着公司业务层面在效仿商汤的模式,仅仅指向管理层的人员履历。 以近年对外发言较多的闫俊杰的基本履历来看,其此前其在商汤科技负责 ...
AI视频大战升级:Sora“神话”被打破?国产模型加速商业化落地
Hua Xia Shi Bao· 2025-06-28 12:01
从东方美学到赛博朋克,从黏土动画到三维写实,《新世界加载中》在不同画风的切换中,开启了全新 的AIGC微短剧叙事。《新世界加载中》是由快手可灵AI与星芒短剧联合出品、由异类Outliers团队制作 的全球首部AI单元故事集,已经在6月26日上线。 多模态大模型带动诸多行业重塑生产环节,由于短剧篇幅较短、市场规模处于快速增长期,且AI生成 能有效降低科幻等题材的特效成本,其成为AIGC最先落地的影视内容。在《新世界加载中》总导演、 异类Outliers创始人陈翔宇看来,AIGC相较于实拍和动画,不仅是效率的提升,更是试错空间的革命性 释放。 2024年开始,一个个视频大模型接踵登场,并在此后不断升级优化,试图抢占竞争高地。而随着AI行 业回归理性,越来越多的企业意识到大模型的商业化落地颇为重要。"可灵AI是一个商业化的产品,确 实有一些商业化目标,但从市场化来看,我们商业化的这些数字更多还是去印证市场和用户需求的可能 性,此刻我们单纯说数字没有什么意义,因为行业还在比较早期阶段,更希望和创作者一起共同探索和 摸索。"可灵AI产品及运营负责人李杨在6月25日接受《华夏时报》记者在内的媒体记者采访时表示。 据记者了 ...
计算机行业重大事项点评:MiniMax:推理模型、Agent与多模态
Huachuang Securities· 2025-06-26 11:04
证 券 研 究 报 告 计算机行业重大事项点评 MiniMax:推理模型、 (维持) Agent 与多模态 事项: ❑ 6 月 17 日,MiniMax 连续五天推出 AI 新品,涉及新的推理模型、视频生成 模型、Agent、语音设计等产品。在发布周首日开源 MiniMax-M1 模型,次日 上线海螺 AI 视频生成模型,后续发布语音设计工具,覆盖推理、视频生成、 智能体等新工具。 评论: 行业研究 计算机 2025 年 06 月 26 日 推荐 华创证券研究所 证券分析师:吴鸣远 邮箱:wumingyuan@hcyjs.com 执业编号:S0360523040001 行业基本数据 | | | 占比% | | --- | --- | --- | | 股票家数(只) | 338 | 0.04 | | 总市值(亿元) | 42,064.50 | 4.18 | | 流通市值(亿元) | 36,270.94 | 4.60 | 相对指数表现 | % | 1M | 6M | 12M | | --- | --- | --- | --- | | 绝对表现 | -2.8% | -7.9% | 35.9% | | 相对表现 | ...
「AI新世代」从推理模型到智能体!MiniMax复刻OpenAI“闪电战”,投资人的耐心还剩多少
Hua Xia Shi Bao· 2025-06-21 09:38
华夏时报(www.chinatimes.net.cn)记者 石飞月 北京报道 作该公司对标Manus的产品;6月20日,Hailuo Video Agent亮相,这是一款视频创作Agent。 这其中会不会产生下一款爆品,现在还未可知,但支柱产品单一对企业来说本身就有很大的市场风险,再加上 Talkie去年还经历了一次下架风波,因此MiniMax扩大产品线的布局是非常必要的。 根据Sensor Tower去年7月的数据,当时Talkie全球月活数据已达到1100万,超过一半用户来自美国,其他市场包括 菲律宾、英国以及加拿大等。然而在去年12月,据媒体报道,Talkie经历了一次被苹果商店下架的风波。对于下架 的原因《华夏时报》记者采访了 MiniMax方面,对方未就此做出回复。 去年12月,OpenAI完成了连续12个工作日的12场直播,本周,"AI六小虎"之一的MiniMax(稀宇科技)效仿 OpenAI,上演了一次新品"闪电战"。截至6月21日,该公司本周已推出开源大规模混合架构推理模型MiniMax- M1、新视频生成模型 Hailuo 02、MiniMax Agent和一款视频创作Agent,预计下周一 ...
一个上海AI独角兽爆发了
投资界· 2025-06-20 08:04
MiniMax上演逆袭。 作者 I 刘博 报道 I 投资界PEdaily 全球AI圈又沸腾起来了。 6月17号,Mi n iMa x "发布周"拉开序幕,又是开源又是发布新模型, 一系列动作令业内 惊呼。 新模型Mi niMa x-M1,是"世界上第一个开源的大规模混合架构的推理模型",被 视为"性价比新王"。值得一提的是,这只是一道"开胃菜"。 Mi n iMa x,这个名字创投圈并不陌生。身后掌舵者是一位8 9年的博士——闫俊杰,他早 年任职于AI四小龙之一的商汤科技,后来在2 022年投身到AGI创业之中。早在Ch a tGPT 爆红前,Mi n iMa x就已经成为国产大模型的代表性企业。 1 9 8 9年,闫俊杰出生在河南的一座小县城。他从中国科学院自动化研究所博士毕业后, 继续在清华大学计算机系从事博士后研究。他的学术成就令人印象深刻——在深度学习和 计算机视觉领域,发表过顶级会议和期刊论文1 0 0余篇, Go ogl e Sc h o l a r引用超过10 0 0 0 次。 博士期间,闫俊杰加入商汤科技,从实习生一路做起,曾任商汤集团副总裁、研究院副院 长 和 智 慧 城 市 事 业 群 C ...
开源还要IPO?MiniMax不想被遗忘在这个夏天
3 6 Ke· 2025-06-20 04:44
文|周鑫雨 编辑|苏建勋 DeepSeek掀桌后,要想证明自己仍在牌桌上,六小虎(MiniMax、智谱、月之暗面、百川智能、零一万物、阶跃星辰)需要证明自己有同DeepSeek掰手腕的 能力。 此前,月之暗面、智谱已经发布了对标DeepSeek R1的推理模型。近期,六小虎又开始了新一轮的推理模型竞速。 MiniMax另一个证明自己仍然留在牌桌上的证据,则是IPO。 2025年4月,智谱成了六小虎中首家提交上市辅导备案的公司,正式走上IPO之路。而近期,另一家六小虎也有了IPO的迹象——彭博社援引知情人士的信息 称,MiniMax计划最早在今年港股上市,并且已为此次IPO聘请了财务顾问。 先是2025年6月17日凌晨,月之暗面开源了编程大模型Kimi-Dev-72B。在针对AI编程能力的SWE-bench测试中,这个仅有72B参数的模型,成绩超越了671B 参数量的R1。 紧接着,MiniMax效仿OpenAI,在同一日宣布了为期五天的新品发布。截至6月19日,MiniMax已经发布了MoE(混合架构)推理模型M1、视频生成模型 Hailuo 02,以及通用Agent产品MiniMax Agent。 △M1在 ...
MiniMax秀了波AI杂技视频,视频生成赛道又卷起来了
Di Yi Cai Jing· 2025-06-18 08:47
这仍然只是技术迭代的初期。 AI视频生成赛道又热闹起来了。4月,快手可灵发布2.0视频生成模型,6月,字节跳动发布了即梦3.0 Pro视频模型,就在昨天,谷歌宣布Veo3正式上线,今 天MiniMax也加入混战队列,开始卷性价比了。 6月18日,MiniMax在海内外官方平台宣布,新视频生成模型海螺AI(海螺02)上线,同时发布了一段大秀杂技的AI视频。官方表示,这段视频是由3位艺术 家耗时1.5天,使用海螺02生成的多个6-10s视频,再拼接剪辑而成。 杂技画面对AI视频生成来说一直是较有难度的内容,此前AI生成画面时往往肢体拼接混乱,无法准确模仿复杂的人类动作。从此次画面效果来看无论是光 影、人类动作、物理模仿都完成得很好。 不过,需要指出的是,有AI创作者对第一财经表示,AI视频生成还涉及一个成功率的问题,因此样片是完美的,但过程中他们进行了多少次"抽卡",外界并 不能知晓。所谓抽卡指的是, AI往往不是一次就能成功生成用户想要的画面,可能会有出错的概率,因此行业会选择多次生成直到得到自己想要的画面。 不过,即便如此,上述AI创作者认为,这次海螺AI的更新是不错的,行业整体水平都在提升。 在竞技场Art ...
5月国内AI应用全景洞察:头部效应加剧,多数赛道增长乏力
Hu Xiu· 2025-06-18 05:37
一、赛道格局:Web端 根据Xsignal AI Holo(AI全息)数据库数据,上图呈现出2025年5月中国Web端AI应用类型的发展全景。为方便您最快速掌握关键要点,X博士为您梳理出 5个关键洞察(5 Key Insights): 1. 量级规模:20个Web端AI应用类型中,1个应用类型MAU破1亿(与4月持平),2个应用类型MAU超1000万(比4月减少1个),13个应用类型MAU超 100万(与4月持平)。榜单首位AI聊天机器人赛道MAU超1.3亿,而末位AI营销工具MAU仅3.42万,赛道量级两级分化明显,也进一步证明了当前AI聊天 机器人占据主导优势; 2. 环比趋势:TOP20 Web端赛道榜单中,呈增长趋势的有3个,平均环比增幅为9.27%,增幅最高的是AI写作(+21.53%)。呈下降趋势的有17个,占到榜 单总数的85%,平均环比降幅为13.53%,降幅最高的赛道是AI办公工具(-45.02%)。整体来看,Web端众多赛道下降明显; 3. AI写作需求激增:AI写作赛道5月MAU环比上涨21.53%,主要与研究生和本科生撰写毕业论文的高峰期有关。5月正值高校毕业论文集中提交与答辩的 关键 ...