Workflow
AI科技大本营
icon
Search documents
超越 Suno,全球首个 CoT 音乐模型Mureka O1 来了!
AI科技大本营· 2025-03-26 10:20
人人都是音乐创作人的时代来临了! 出品丨AI 科技大本营(ID:rgznai100) AI 正渗透各行各业,前不久,一首由 AI 创作的歌曲火爆出圈,在短短几天内登上热歌榜单。AI 正在为音乐爱好者打开音乐创作之门。据 Fortune Business Insights 数据显示,2023年全球数字音频工作站(DAW, Digital Audio Workstation)市场规模高达约30亿美元,预计2026年约70%的 DAW企业将使用AI技术辅助音乐创作。 《Mureka》AI 音乐人 MV 全网首发,歌手:Mureka;该作品由 AI 生成,其中音乐由 Mureka 生成,视频由 SkyReels 技术支持生成。 点开这首《童年的夜晚》,旋律柔和动听,人声温柔真挚,咬字清晰,歌词很贴近提示词的风格,完全没有 AI 感,很不错。 将生成的歌曲下载下来后,小编发现它支持音轨分离下载。普通歌曲下载只有一条音轨,而Mureka 提供音乐生成的独立的人声、伴奏等多轨输出,比 如鼓声、贝斯等,这样对编曲者来说无疑是二次创作的神器,方便用户后续混音。 什么?你说提示词生成是小case啦?来,上难度,点击高级模式,Mu ...
美国机器人“四小龙”:通用机器人仍需十年,专用机器人即将出现,机器人的扩展法则会在五年内被探索出来 | GTC 2025
AI科技大本营· 2025-03-26 10:20
我们这一代人 出生得太晚,没能赶上探索地球的地理大发现时代; 我们出生得又太早,可能无法亲身参与星际旅行,探索其他星系。 但我们却恰逢其时, 躬逢其盛,见证并参与到解决机器人技术难题的伟大历史进程中。相信在不久的将来,所有能够移动的物体都将实现自主化。 责编 | 王启隆 出品丨AI 科技大本营(ID:rgznai100) 今天这篇文章将会回顾英伟达大会重点宣传的一个论坛:《 通用机器人的新时代:人形机器人崛起 》(A New Era of Generalist Robotics: The Rise of Humanoids),英伟达跟紧物理世界 AI 和具身智能的新风向,邀请到美国 四家 顶尖的 人形机器人 公司老板,参与这场对话。 那么问题来了,现在全世界的人形机器人领域都有哪些顶级公司呢? 相信很多人和小编一样,只认识国内的宇树机器人,对国外现在的机器人战局不太 了解,所以我们先看一张图,了解当前的时局情况: | 特斯拉 | | Google | | NVIDIA | | | | --- | --- | --- | --- | --- | --- | --- | | 美国 | | 美国 | | 美国 | ...
大模型“神仙打架”,掀起复现潮、技术大升级后,我们需要关注什么? | 万有引力
AI科技大本营· 2025-03-25 01:45
以下文章来源于CSDN ,作者万有引力 CSDN . 成就一亿技术人 作者 | 万有引力 出品 | CSDN(ID:CSDNnews) 在过去短短的几周里,大模型赛道的信息密度飙升至前所未有的高度。DeepSeek 连续 五天开源 ,直接引发了一场复现热潮;阿里巴巴通义实验室、 腾讯相继推出面向视觉文档的 RAG 系统 ViDoRAG、新一代混元快思考模型 Turbo S ,加速了大模型的演进步伐;马斯克用 20 万张 GPU 训练出的 Grok 3 ,超越了许多业界标杆,再次验证了"大力出奇迹"的定律; Claude 3.7 Sonnet 迎来编码能力大升级,AI 编程的技术平权时代正在加速到来; DeepSeek 论文与 Kimi"撞车",越来越多公司开始布局稀疏注意力与线性注意力机制,这些技术正成为 Transformer 之后的关键探索方向;此外, Manus 模式的"虚拟机"概 念迅速走红,正在重塑大模型的运行方式... 在这场眼花缭乱的技术竞赛背后,真正值得我们关注的是什么?DeepSeek 的五连发 究竟意欲何为?在 545% 的成本利润率之下,其他大模型公司是 否也能找到盈利空间?面对行业变 ...
2025人工智能系列活动全景透视,慕尼黑上海电子展邀您共探未来!
AI科技大本营· 2025-03-25 01:45
继 DeepSeek 一夜刷屏后,近日发布的 AI Agent 产品 Manus 再次震撼科技圈,"一石激起千层浪", 各行各业都翘首以盼 AI 带来的颠覆式创新。 当然,AI+终端应用的落地也离不开政策托举,在今年全国两会期间,政府工作报告再度提及"人工智 能+",持续推进"人工智能+"行动,将数字技术与制造优势、市场优势更好结合起来,支持大模型广 泛应用,大力发展智能网联新能源汽车、人工智能手机和电脑、智能机器人等新一代智能终端以及智 能制造装备。 在今年 4月15-17日 即将在上海新国际博览中心开幕的 慕尼黑上海电子展 上,主办方将重磅推出 "人 工智能联合展区"、"AI技术创新论坛"、 "人形机器人展示区"、"人形机器人创新论坛 " 等系列活 动,集产品展示、技术展示、应用体验和行业交流于一体;通过展示新的AI技术和应用,将为观众呈 现AI在未来生活中的无限可能。同期的 "医疗电子创新论坛" 和 "嵌入式系统创新论坛 "也将涵盖不 少AI+的相关话题,一起来跟小编看看吧~ PART.01 人工智能联合展区 地点:上海新国际博览中心丨N5馆N5.749 时间:2025年4月15-17日 2025慕尼黑 ...
OpenAI研究负责人诺姆·布朗:基准测试比数字大小毫无意义,未来靠token成本衡量模型智能|GTC 2025
AI科技大本营· 2025-03-24 08:39
责编 | 王启隆 出品丨AI 科技大本营(ID:rgznai100) 今年英伟达大会(GTC 2025)邀请到了 OpenAI 的人工智能推理研究负责人、OpenAI o1 作者 诺姆·布朗(Noam Brown) 参与圆桌对话。 他先是带着大家回顾了自己早期发明"德扑 AI"的工作,当时很多实验室都在研究玩游戏的 AI,但大家都觉得摩尔定律或者扩展法则(Scaling Law)这 些算力条件才是突破关键。诺姆则在最后才顿悟发现,范式的更改才是真正的答案:" 如果人们当时就找到了正确的方法和算法,那多人扑克 AI 会提前 20 年实现 。 " 究其根本原因,其实还是很多研究方向曾经被忽视了。" 在项目开始前,没有人意识到 推理计算会带来这么大的差异。 " 毕竟,试错的代价是非常惨痛的,诺姆·布朗用一句很富有哲思的话总结了直到现在都适用的一大问题:" 探索全新的研究范式,通常不需要大量的计算 资源。但是,要大规模地验证这些新范式,肯定需要大量的计算投入。 " 左为英伟达专家布莱恩·卡坦扎罗,中为诺姆·布朗,右为主持人瓦尔蒂卡 在和英伟达专家的对话过程中,诺姆还对自己加入 OpenAI 之前、成为" 德扑 AI ...
小红书技术专家解密语音识别与推荐算法,干货满满|ML Summit 2025
AI科技大本营· 2025-03-24 08:39
4 月 18-19 日,由 CSDN&Boolan 联合举办的 2025 全球机器学习技术大会(ML-Summit 2025)将在上海虹桥西郊庄园丽笙大酒店隆重举行。大会 汇聚了超过 50 位来自学术界和工业界顶尖专家,共同探讨智能体、联邦学习、多模态大模型等热门 AI 技术实践。本次大会的一大亮点是小红书社区 技术部将派出两位技术负责人,分享他们在语音识别与推荐算法领域的最新研究成果与实践经验。 解奉龙毕业于哈尔滨工业大学-微软亚洲研究院联合培养博士毕业,是 2015 年"微软学者"称号获得者,并在 2023 国际语音合成大赛 Blizzard Challenge 中荣获单项冠军。目前,他在小红书负责语音识别与合成、语音交互、音乐技术在小红书全场景下的研发及落地,并主导打造了基于大模 型的语音/音乐技术前沿综合解决方案 FireRed。 小红书音频技术负责人解奉龙:FireRed-基于大模型的语音/音乐技术综合实践 在本次大会上,解奉龙博士将带来《FireRed-基于大模型的语音/音乐技术综合实践》的精彩演讲。他将分享小红书技术团队研发的一系列基于大模型 的语音/音乐技术详情及应用落地,包括: FireRe ...
杨立昆“砸场”英伟达:不太认同黄仁勋,目前大模型的推理方式根本是错的,token 不是表示物理世界的正确方式|GTC 2025
AI科技大本营· 2025-03-21 06:35
责编 | 王启隆 出品丨AI 科技大本营(ID:rgznai100) 黄教主的演讲 感觉才没过几天,今年的 GTC 英伟达大会也即将迎来尾声了。 而今年比尔·达利则是对话"AI 教父" 杨立昆 (Yann LeCun),很有前后呼应的感觉。 但 GTC 并不只有黄仁勋和杨立昆,还有许多精彩的演讲与对话,比方说: ………… 接下来的一段时间, CSDN AI 科技大本营 将会在「 GTC 2025 大师谈 」栏目持续更新这些精华内容的全文整理,尽情期待。 比尔·达利 自己就在采访杨立昆之后进行了一场 演讲 ,系统性地讲解了英伟达 2024 一整年的四大项目进展,内容干货很多; OpenAI o1 作者 诺姆·布朗 (Noam Brown)和英伟达的 AI 科学家来了一场 对话 ,他认为现在 AI 圈最需要来一场革命的,就是这些五花八 门的 基准测试 (Benchmark),而且改这个东西还不需要花太多算力资源; 2018 年诺贝尔化学奖得主 弗朗西斯·阿诺德 (Frances Arnold)围绕 AI for Sciense 还有蛋白质工程进行了一场相当硬核的 圆桌对话 ; UC 伯克利教授 彼得·阿比尔 (P ...
阶跃星辰 Tech Fellow 段楠:Step-Video 系列模型的关键技术解读
AI科技大本营· 2025-03-21 06:35
4 月 18-19 日,由 CSDN&Boolan 联合举办的「2025 全球机器学习技术大会」将在上海虹桥西郊庄园丽笙大酒店隆重举行,本次大会共设 12 大技术 专题,云集院士、IEEE Fellow、顶尖学者、一线科技企业技术实战专家组成的超 50 位重磅嘉宾。他们将以独特的视角,解读智能体、联邦学习、多 模态大模型、强化学习等前沿议题。 在 4 月 18 日下午,走在多模态研究前沿的阶跃星辰 Tech Fellow,多模态基础模型领域专家段楠博士将在「多模态大模型前沿」专场带来《视频生成 基础模型进展、挑战和未来》的主题分享,分享其在视频生成基础模型方面的最新研究成果和前瞻性思考。 段楠博士拥有深厚的学术背景和丰富的产业经验。他长期深耕自然语言处理、代码智能、多模态基础模型和智能体等领域,是中国科学技术大学和西安 交通大学兼职博导,天津大学兼职教授。在加入阶跃星辰之前,段楠博士曾在微软亚洲研究院担任资深首席研究员及自然语言计算团队研究经理长达十 二年,对自然语言处理和多模态技术的发展做出了卓越贡献。 在 2025 全球机器学习技术大会上,段楠博士将围绕阶跃星辰开源的 Step-Video 系列模型,深入 ...
3小时复刻传奇,OpenManus一作梁新兵:通用Agent的构建与赋能
AI科技大本营· 2025-03-20 09:07
4 月 18-19 日,由 CSDN&Boolan 联合举办的 2025 全球机器学习技术大会(ML-Summit 2025)将在上海虹桥西郊庄园丽笙大酒店隆重举行。大会 云集院士、顶尖学者、IEEE Fellow、一线科技企业技术实战专家组成的超 50 位重磅嘉宾。他们将以独特的视角,解读智能体、联邦学习、多模态大 模型、强化学习等覆盖 AI 当下热门的技术实践专题。 在大会首日下午的「AI 智能体」专题论坛上,来自 DeepWisdom 算法研究 员、OpenManus 项目一作,MetaGPT 开源核心贡献者梁新兵将带来 《通用 Agent 的构建与赋能:OpenManus 的实践与探索》分享。 梁新兵是 DeepWisdom 算法研究员,华东师范大学硕士。他不仅是 OpenManus 项目一作,同时也是论文 Data Interpreter /Self-Supervised Prompt Optimization 作者之一。如今,他正以其在智能体领域的丰富经验和 对开源的满腔热情,不断探索通用 Agent 的构建与赋能。 3 小时复刻传奇:OpenManus 背后的极速行动 作为 MetaGPT 开源 ...
黄仁勋年度演讲来了,Scaling Law失效只是假象,推理需求暴涨100倍,AI模型优化迎来新挑战|GTC 2025
AI科技大本营· 2025-03-19 01:49
作者 | 王启隆 出品 | CSDN(ID:CSDNnews) 北京时间 3 月 19 日凌晨,NVIDIA GTC 2025 的主会开场演讲来了! 在黄仁勋的这场演讲前,英伟达股票还是 119.53 美元 。刷推的时候又发现,马斯克的 Grok AI 都 在和网友们吐槽英伟达今年开年不济,相当艰难,需要一场演讲拯救股市,振奋投资者。还有些直 播,直接开了个股市页面实时盯着 NVDA 涨涨停停,画面相当喜感。 两小时的演讲结束后,股价居然还跌了将近 3%…… 今年的演讲主题是「 AI 工厂 」。 英伟达创始人兼 CEO 黄仁勋身穿标志性的皮衣,潇洒上台。 下面先简单总结演讲的内容有哪些(正好黄仁勋自己在最后强调了一遍本次主会的 五大亮点 ),后 文我们再来个 "事无巨细"的 全面回顾 ,带大家云体验一遍全程。 Blackwell 全面投入生产 第一代 Blackwell 芯片还没热乎,英伟达就推出了下一代 Blackwell Ultra,旨在 提升训练和扩展 推理能力。主会上展示了两个版本: 顺带一提,看外媒的现场返图,英伟达这次在 GTC 大会会馆前 摆了个摊卖煎饼 ,黄仁勋 亲自上阵 边吃边卖, 里面穿着 ...