Workflow
语音处理
icon
Search documents
“AI大神”李沐终于开源新模型,爆肝6个月,上线迅速斩获3.6k stars!
AI前线· 2025-07-25 05:36
整理 | 褚杏娟 7 月 23 日,"AI 大神"李沐宣布开源了 Higgs Audio v2,这是一个音频基础模型,构建在 Llama-3.2- 3B 基础之上,预训练数据包括超过 1000 万小时的音频以及丰富的文本数据。该模型目前在 Github 上已获得 3.6k stars。 "去年我们一直关注的是文本语言模型,让它智商足够高、能听从人的指示,一方面可以陪人玩游 戏,另一方面也能帮忙处理一些文案工作,简单来说就是能读能写。今年我们在想,能不能让模型能 听也能说。"李沐在 B 站发布的视频中说道。 随后,他表示,"语音是 AI 中一个相对比较悠久的领域,我其实并不是语音方面的专家。作为一个新 手,我的想法很简单,就是我不要去训练单独的语音模型,而是在文本大语言模型训练时加入大量的 语音数据,大力出奇迹,就想让文本语言模型智商不要下降,但同时掌握了用语音沟通的能力。" 李沐是全球知名 AI 深度学习科学家、深度学习框架 MXNet 作者之一,2008 年毕业于上海交通大学 计算机系,曾于微软亚洲研究院实习。毕业后任香港科技大学研究助理,2011 年加入百度任高级研 发;2012 年赴卡耐基梅隆大学攻读博 ...
语音领域ISCA Fellow 2025公布:上海交大俞凯、台大李宏毅等三位华人入选
机器之心· 2025-04-28 23:04
机器之心报道 机器之心编辑部 近日,ISCA Fellow 2025 入选结果揭晓! ISCA Fellow 是由国际语音通讯协会(International Speech Communication Association,ISCA)设立的荣誉称号,旨在表彰在语音通信科学与技术领域做出杰出贡献 的会员,包括研究人员、工程师和学者。 该奖项设立于 2007 年,每年新晋 Fellow 不超过当年 ISCA 会员总数的千分之三,确保稀有性和权威性。 自设立以来,ISCA Fellow 人数已经超过 100 人。ISCA Fellow 2025 入选者共有 8 位,包括以下三位华人学者: 华人入选者 俞凯 个人简介: 俞凯,思必驰联合创始人、首席科学家,上海交通大学特聘教授,清华大学本科、硕士,剑桥大学博士。入选国家级重大人才工程,国家自然科学基 金委优青,上海市「东方学者」特 聘 教 授 。IEEE 信号处理学会会议理事会 (Conference Board) 和会员理事会 (Membership Board) 理事,IEEE Speech and Language Processing Technical C ...