1.1 综述 语音是人类信息活动的重要手段之一,语音不仅是人与人之间进行信息交流的最直接﹑最方便的和最有效的工具。人机对话意味着计算机应该具有语音输入和语音识别的功能,即计算机具有听觉,能够“听懂”人话,这就是语音识别的功能。无论,人与人之间,还是人与计算机之间的语音通信,语音信号处理,特别是语音信号处理的理论和技术,都具有特别重要的作用。 数字语音处理包含三个方面内容:语音信号的数字表达方法﹑语音信号的数字处理的各种方法﹑以及数字语音处理理论和技术在各个领域的应用。这些内容涉及到了数字信号处理﹑计算机科学﹑模式识别﹑语音学﹑生理学等学科,还涉及到通信和电子系统,信号和信息处理系统等具体的应用领域。 对于语音信号,数字处理比模拟处理具有更多优点。这是因为:第一,数字技术能够完成很多很复杂的信号处理工作;第二,通过语音进行交换的信息,本质上具有离散的性质,因为语音可以看成是语素的组合,这就特别适用于数字处理;第三,数字语音具有更高的可靠性﹑价廉﹑紧凑﹑快速等特点,很容易完成实时处理要求;第四,数字语音具有在强干扰信道中传输的特点,易于和数据一起在通信网中传输,也易于进行加密传输,因此,数字语音也是主要研究方向。 语音信号处理的方法是多种多样的。和一般的数字与信号的处理相类似,其方法可以是时域的,也可以是频域的,但都应考虑到语音信号本身的特点。语音信号是时变信号,只是在一个一个短段内才可以看成平稳的,因此,短时处理是处理语音信号的一种基本方法。在时域内,这就是各种短时处理技术的方法,如短时能量﹑短是平均过零率及短时自相关函数等计算;在频域内,这就是短时傅立叶变换方法。线性预测技术本质上属于时域分析方法,但结果可以是频域的参数。 ...... |
查看评论
已有0位网友发表了看法