一种视听融合的语音识别系统

2024-07-08 来源：小奈知识网

（19）中华人民共和国国家知识产权局

（12）发明专利申请

（21）申请号 CN201410140715.7 （22）申请日 2014.04.09

（71）申请人天津思博科科技发展有限公司

地址 300384 天津市滨海新区华苑产业区海泰发展六道6号海泰绿色产业基地K1座4

（10）申请公布号 CN104036775A

（43）申请公布日 2014.09.10

门202室

（72）发明人不公告发明人（74）专利代理机构

代理人

（51）Int.CI

权利要求说明书说明书幅图

（54）发明名称

一种视听融合的语音识别系统

（57）摘要

本发明公开了一种视听融合的语音识别系

统，采用视听耦合隐马尔科夫模型（Coupled Hidden Markov Model，CHMM），目的在于通过对视频信号和音频信号不同的采样率及延迟，允许了视听状态之间的状态的不同步（不用考虑视听同步过程）。一种视听融合的语音识别系统，包括：音频特征提取、视频特征提取、建立CHMM模型三个步骤。三个步骤之间的关系如下：对于视

听语音识别系统而言就是由音频的HMM和视频的HMM组成。与单条链的HMM不同，CHMM可以通过节点之间的状态转移概率捕捉到音频和视频之间的相互作用关系，允许音频信息和视频信息的状态的异步。另外，对于耦合隐马尔科夫模型而言，音频链和视频链所利用的最大期望算法（EM算法）进行参数估计的过程是独立的，与需要实时关联的音频视频模型相比减小了参数空间和参数复杂性。

法律状态

法律状态公告日

法律状态信息

2014-09-10 公开

2014-10-15 实质审查的生效

2017-06-06

发明专利申请公布后的视为撤回

法律状态

公开

实质审查的生效

发明专利申请公布后的视为撤回

权利要求说明书

一种视听融合的语音识别系统的权利要求说明书内容是....请下载后查看

说明书

一种视听融合的语音识别系统的说明书内容是....请下载后查看

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文

全部栏目

一种视听融合的语音识别系统