Workflow
音频生成
icon
Search documents
ICML25 | 让耳朵「看见」方向!仅依靠360°全景视频,就能生成3D空间音频
量子位· 2025-05-14 08:55
然而,现有的技术大多基于固定的视角视频,缺乏对360°全景视频中空间信息的充分利用。 OmniAudio团队 投稿 量子位 | 公众号 QbitAI 空间音频,作为一种能够模拟真实听觉环境的技术,正逐渐成为提升沉浸式体验的关键。 在这样的背景下,一项在空间音频生成领域具有里程碑意义的研究应运而生—— OmniAudio :它能够直接从360°视频生成空间音频,为虚 拟现实和沉浸式娱乐带来了全新的可能性。 相关代码和数据集已开源: https://github.com/liuhuadai/OmniAudio 为何需要从360°视频生成空间音频? 传统的视频到音频生成技术主要关注于生成非空间音频,比如手机外放或者耳机里的声音,这些音频缺乏方向信息,无法满足沉浸式体验对 3D声音定位的需求。 所以看VR电影或者玩动作游戏的时候,总会觉得少了些代入感。 随着360°摄像头的普及和虚拟现实技术的发展,如何利用全景视频生成与之匹配的空间音频,就成为了一个亟待解决的问题。 为应对这些挑战,OmniAudio的研究团队提出了 360V2SA (360-degree Video to Spatial Audio)任务,旨在直接 ...
昆仑万维:一季度营收大幅增长46% AI算力芯片取得突破性进展
(原标题:昆仑万维(300418):一季度营收大幅增长46%AI算力芯片取得突破性进展) 4月29日,昆仑万维(300418.SZ)披露2025年一季度业绩报告。报告期内,公司实现营业收入17.6亿元, 同比增长46%,全力推动AI算力芯片、大模型及应用的研发迭代工作,研发费用4.3亿元,同比增长 23%。 截至报告期末,公司AI音乐年化流水收入ARR达到约1200万美金(月流水收入约100万美金);短剧平台 Dramawave年化流水收入ARR达到约1.2亿美金(月流水收入约1000万美金),为收入增长注入强劲动力。 公司全球化战略成效显著,实现海外业务收入16.7亿元,同比增长56%,海外业务收入占比提升至 94%,国际化布局进一步深化。 公司在多模态推理、视频生成、音频生成等关键方向,推出多项颠覆性技术与开源成果。公司发布的 Skywork R1V多模态推理模型达到开源SOTA(State of The Art,当前最佳水平);视频生成领域, SkyReels-V1模型与支持精准表情动作控制的SkyReels-A1算法位居全球领先地位,后者更实现技术突破 性SOTA;AI音乐领域,Mureka V6与全 ...