X为了获得更好的用户体验,请使用火狐、谷歌、360浏览器极速模式或IE8及以上版本的浏览器
平台简介 | 帮助中心
欢迎来到科易厦门城市创新综合服务平台,请 登录 | 注册
尊敬的 , 欢迎光临!  [会员中心]  [退出登录]
当前位置: 首页 >  科技成果  > 详细页

[01025409]语音增强技术及其在音视频会议系统中的应用

交易价格: 面议

所属行业: 广播电视

类型: 非专利

交易方式: 资料待完善

联系人:

所在地:

服务承诺
产权明晰
资料保密
对所交付的所有资料进行保密
如实描述
|
收藏
|

技术详细介绍

复杂环境下较差的抗噪性和声音音质制约了国产音视频会议系统品牌的市场竞争力。针对音视频会议系统的前端声信号采集与增强问题及行业发展的急迫需求,该技术研发团队在国家自然科学基金、江苏省自然科学基金等资金支持下,攻克语音降噪和回声消除等语音增强关键技术,完成了具有自主知识产权的融合声源定位、语音降噪、回声消除等一系列语音增强算法的音视频电话会议系统,打破了国外产品在该领域的垄断地位。在中关在线的会议电话品牌排行榜上,深圳市音络科技有限公司的市场占用率达到81.9%,远高于国际知名品牌宝利通的9.8%。 项目主要技术创新包括: (1)突破机械设计理论,设计仿人耳听觉的声源定位及语音增强算法。为解决复杂环境下的语音质量下降严重的问题,该项目通过仿人耳听觉感知机理,提出一种双耳(双麦克风)声源定位与增强方法。算法首先借鉴耳蜗分频特性和听觉掩蔽特性,将声音信号进行多通道分解,并提取人耳敏感频带的信号进行双麦克风时间差估计;然后基于人耳哈斯效应,提取有效的时间差信息并估计声源方向,最后基于声源位置调节增益参数并合成增强后的语音; (2)改善语音降噪方法,提升音视频会议系统的声音质量,该团队提出一种改进的实时多通道语音降噪算法。 (3)改善声源定位效率,提高方向性语音增强性能。双耳方向性增强算法受声源定位精度影响,为此该项目提出两种改进策略:针对小麦克风阵,课题组提出采用差分微麦克风信号构建信号模型,并通过评估重构信号的能量峰值获得声源位置的方法;针对声源定位环境中的强噪声、干扰和共振的环境,提出基于特征值分解的鲁棒声源定位算法。 (4)增强回声消除能力,改善音视频会议系统双讲下的双耳定位与语音增强性能。针对音视频会议系统的双讲问题,课题组提出三种改进方法:1)提出一种基于状态分类的变步长标准最小均方差算法来估计回声信号;2)提出线性预测-并行梯度投影算法,通过对声音信号进行线性预测获得解相关信号,然后设计并行梯度投影算法去估计回声路径;3)针对音视频会议系统的啸叫问题,提出根据增益大小切换通话模式的方式来进行啸叫消除。 在技术创新的基础之上,该项目设计并开发了多款结合上述技术创新的音视频会议系统的软硬件。近两年,应用该项目技术创新的深圳市音络科技有限公司销售额达到4748.59万元,取得利润1899.43万元;应用该技术创新的北京瑞天平安信息技术有限公司销售额达到1243.5万元,取得利润378.73万元。公司产品已获得了国内许多知名企业和研究院校的认可,合作伙伴包括阿里巴巴、海康威视、浙江大华、PICC、美的集团、北京大学等。依托上述技术创新,该团队共申请或授权国家发明专利10项,授权实用新型专利3项,产品外观专利7项,取得软件著作权3项,发表SCI检索论文10余篇,EI检索论文30余篇;技术团队培养骨干教师4名,博士4名,硕士10名。
复杂环境下较差的抗噪性和声音音质制约了国产音视频会议系统品牌的市场竞争力。针对音视频会议系统的前端声信号采集与增强问题及行业发展的急迫需求,该技术研发团队在国家自然科学基金、江苏省自然科学基金等资金支持下,攻克语音降噪和回声消除等语音增强关键技术,完成了具有自主知识产权的融合声源定位、语音降噪、回声消除等一系列语音增强算法的音视频电话会议系统,打破了国外产品在该领域的垄断地位。在中关在线的会议电话品牌排行榜上,深圳市音络科技有限公司的市场占用率达到81.9%,远高于国际知名品牌宝利通的9.8%。 项目主要技术创新包括: (1)突破机械设计理论,设计仿人耳听觉的声源定位及语音增强算法。为解决复杂环境下的语音质量下降严重的问题,该项目通过仿人耳听觉感知机理,提出一种双耳(双麦克风)声源定位与增强方法。算法首先借鉴耳蜗分频特性和听觉掩蔽特性,将声音信号进行多通道分解,并提取人耳敏感频带的信号进行双麦克风时间差估计;然后基于人耳哈斯效应,提取有效的时间差信息并估计声源方向,最后基于声源位置调节增益参数并合成增强后的语音; (2)改善语音降噪方法,提升音视频会议系统的声音质量,该团队提出一种改进的实时多通道语音降噪算法。 (3)改善声源定位效率,提高方向性语音增强性能。双耳方向性增强算法受声源定位精度影响,为此该项目提出两种改进策略:针对小麦克风阵,课题组提出采用差分微麦克风信号构建信号模型,并通过评估重构信号的能量峰值获得声源位置的方法;针对声源定位环境中的强噪声、干扰和共振的环境,提出基于特征值分解的鲁棒声源定位算法。 (4)增强回声消除能力,改善音视频会议系统双讲下的双耳定位与语音增强性能。针对音视频会议系统的双讲问题,课题组提出三种改进方法:1)提出一种基于状态分类的变步长标准最小均方差算法来估计回声信号;2)提出线性预测-并行梯度投影算法,通过对声音信号进行线性预测获得解相关信号,然后设计并行梯度投影算法去估计回声路径;3)针对音视频会议系统的啸叫问题,提出根据增益大小切换通话模式的方式来进行啸叫消除。 在技术创新的基础之上,该项目设计并开发了多款结合上述技术创新的音视频会议系统的软硬件。近两年,应用该项目技术创新的深圳市音络科技有限公司销售额达到4748.59万元,取得利润1899.43万元;应用该技术创新的北京瑞天平安信息技术有限公司销售额达到1243.5万元,取得利润378.73万元。公司产品已获得了国内许多知名企业和研究院校的认可,合作伙伴包括阿里巴巴、海康威视、浙江大华、PICC、美的集团、北京大学等。依托上述技术创新,该团队共申请或授权国家发明专利10项,授权实用新型专利3项,产品外观专利7项,取得软件著作权3项,发表SCI检索论文10余篇,EI检索论文30余篇;技术团队培养骨干教师4名,博士4名,硕士10名。

推荐服务:

智能制造服务热线:0592-5380947

运营商:厦门科易帮信息技术有限公司     

增值电信业务许可证:闽B2-20100023      闽ICP备07063032号-5