云知声申请一种基于噪声解构训练策略的语音识别模型专利,降低计算复杂度

Connor 币安app官网下载 2025-08-14 2 0

金融界2025年8月13日消息,国家知识产权局信息显示,上海师范大学;云知声智能科技股份有限公司申请一项名为“模型训练及语音识别方法、装置、设备及介质”的专利,公开号CN120472886A,申请日期为2025年05月。

专利摘要显示,本申请公开了一种基于噪声解构的语音识别模型的训练方法及语音识别方法、装置、设备及介质。采用先隔离训练噪声解缠模块,再微调训练Conformer‑Transducer架构的阶段式训练策略,避免了同时训练多个复杂模块带来的高计算复杂度和训练难度。在隔离训练阶段,可以快速优化噪声解缠模块的性能;在微调训练阶段,利用已训练好的噪声解缠模块,集中精力优化Conformer‑Transducer架构,提高训练效率,减少训练时间和计算资源的消耗。在隔离训练和微调训练过程中,对部分模块的参数进行冻结,减少了需要优化的参数数量,从而降低了计算复杂度。通过噪声解缠模块将语音信号中的噪声和纯净语音进行解构,再结合Conformer‑Transducer架构进行准确的语义理解,使整个语音识别模型对噪声具有更强的鲁棒性。

来源:金融界

评论