[计算机应用] 非特定人连续数字识别方法与汉语语音数.._计算机应用论文

[计算机应用] 非特定人连续数字识别方法与汉语语音数..

简介： 原文语言是人类获得信息的主要来源之一，是人与外界交流信息的最方便、最有效、最自然的工具。随着计算机科学与应用的发展，出现了计算机语音学(Computer Phonetics)。人们对计算机语音的研究主要有以下几个方面：&#8226;语音编码(Spee...

请与管理员联系购买资料 QQ:5739126

原文

语言是人类获得信息的主要来源之一，是人与外界交流信息的最方便、最有
效、最自然的工具。随着计算机科学与应用的发展，出现了计算机语音学
(Computer Phonetics)。人们对计算机语音的研究主要有以下几个方面：
•语音编码(Speech Coding)；
•语音合成(Speech Synthsis)；
•语音识别(Speech Recognition)；
•话者识别(Speaker Recognition)或
话者确认(Speaker Verification)。
语音识别(SR)就是让计算机听懂人说话，它是发展人机声通信和新一代智能
计算机的重要组成部分。它有几种分类方法：按被识别人的范围可分为特定人
(Speaker Dependent)和非特定人(Speaker Independent)语音识别；按词汇量的大小
可分为小词汇量(Small Vocabulary)和大词汇量(Large Vocabulary)语音识别；按说
话方式可分为孤立词(Isolated Word)和连续语音或连接词(Continuous Speech or
Connected Word)语音识别。它们的难易程度如表1.1所示(E：易， D：难)。
表1.1 语音识别难易评价表
适应对象词汇量识别方式难易评价说明
孤立词EEE 较易
小词汇量
连续语音EED 较难
孤立词EDE 较难
特定人
大词汇量
连续语音EDD 很难
孤立词DEE 较难
小词汇量
连续语音DED 很难
孤立词DDE 很难
非特定人
大词汇量
连续语音DDD 极难
§1.1 SR 的早期研究(76 年以前)
......

摘要
第一章综述
第二章语音识别的基本知识
第三章隐马尔可夫模型的语音识别中的应用
第四章基于非线性分块原理的分段概率模型
第五章连续非特定人汉语数字识别系统的构成
第六章汉语语音数据库的建立
参考文献

简单介绍

摘要
本文对非特定人连续数字识别方法进行了研究。作者在经过大量
实验之后，确定了一种识别算法：首先，使用基于非线性分块的分段
概率模型，在识别时，参考模型各状态的分数估算用段长度进行规整
(平均)；其次，使用声调(概率)评价函数，这个函数给出了某数字为
三类声调(一声类、二三声类和四声类)中每一类的概率；同时，考虑
到连续语音中毗邻音节之间相互影响，采用与音节所处位置有关的多
套模型。使用上述的策略建立的系统，其识别效果有相当大的改善。
本文还介绍了一个以汉语普通话为基础的汉语语音数据库，这样
的数据库，对语音识别、语音分析甚至语言理解方面的研究工作都将
有很大帮助。
关键词：非特定人连续数字识别，非线性分块，分段概率模型，声调概率)评价函数，汉语语音数据库

[计算机应用] 非特定人连续数字识别方法与汉语语音数..

栏目导航

热门关键词

最新论文

随机论文