Workflow
“AI+粤语” 科大讯飞携手香港特区立法会突破业界难题

日前,香港特区立法会正式宣布,其与科大讯飞联合打造的搭载AI实时字幕功能的智慧誊录系统"智识 听"正式上线。 在一系列成果背后,是科大讯飞在智能语音技术领域的深厚积淀。2024年,由科大讯飞牵头的"多语种 智能语音关键技术及产业化"项目获得2023年度国家科学技术进步奖一等奖,构建起具有中国自主知识 产权的多语种智能语音技术体系。 其实早在2014年,科大讯飞便开始研究包括中国部分民族语言在内的小语种智能语音技术,与北京外国 语大学、上海外国语大学等建立密切合作,积累了宝贵资源,沉淀大量技术。 例如,针对部分小语种训练知识匮乏、训练数据稀缺,团队设计出全新的多语种通用音素体系和基本语 言单元,实现多语种统一音素韵律体系的构建。在训练数据数量、质量有限的情况下,显著提升了小语 种语音系统性能。 此外,为解决复杂应用场景下语音交互、语音翻译面临的深层次语义理解困难、专业性不足等难题,研 发团队还提出了多源知识增强的可信文本生成技术,提升专有词汇及领域知识引用的准确率。 "智识听"深度适配会议场景的AI实时字幕功能,运用了科大讯飞中英粤混读引擎,结合声纹识别和字幕 与帧画面对齐压制技术,可实现会议直播中文字和视频画 ...