您现在的位置:网站首页答辩论文工学论文电子论文

从人工智能到智能环境:语音识别中的难题

  • 简介:(毕业论文 页数:21 字数:10752)摘要:语音识别领域的研究近来取得的进展从根本上讲是受市场需求的驱使。语音识别引擎主要基于以数字为核心的DTW(动态时间归正技术)和HMM(隐含马尔可夫模型)技术。目前的语音识别引擎的结构与人类的听觉系统几乎没有共同...
    • 请与管理员联系购买资料 QQ:5739126
  • 论文简介
  • 相关论文
  • 论文下载

(毕业论文 页数:21 字数:10752)摘要:语音识别领域的研究近来取得的进展从根本上讲是受市场需求的驱使。语音识别引擎主要基于以数字为核心的DTW(动态时间归正技术)和HMM(隐含马尔可夫模型)技术。目前的语音识别引擎的结构与人类的听觉系统几乎没有共同之处。现有的语音识别技术并没有完全利用心理学上积累的语音感知方面的知识。相应的,心理学中语音感知研究也没有充分关注语音识别技术的需求。

 

 

目录

1.引言:
2.语音技术:应用软件和前景
3.人与人之间的交流:语音感知、语音识别和语音理解
4.语音识别的一些问题

 

1.引言:
长期困扰人工智能领域,特别是语音识别问题领域的一个因素是智能环境。“智能环境”是当前流行的一个现象,作为一个全新的、十分模糊但已被充分确定的术语,此处我们讲它有些不合逻辑。 超过半数的消费者深受智能电话、智能笔、智能卡以及其它有利用价值的智能器具的吸引。他们认为这些东西能够提高办公室的办事效率,也可以让我们的住宅环境更加舒适。这一现象对科学家和技术专家相当重要,因为它是对当前这一领域研究成果的一个市场的反馈。一方面,这一现象提醒我们,在商业界这一技术目前正处在困境中;另一方面,人工智能的成就显而易见,从专家到外行人都能讲述这一技术带来的好处,人人都想在日常生活中运用这一技术。
大约五十年前,世界各地众多的实验室都完成了许多关于简单发声识别的实验,从此,语音识别技术日趋成熟。参与研究的实验室有:Bell Laboratories(贝尔实验室)、RCA Labs(美国无线电公司实验室)、University College in England(英国的大学学院)、MIT Lincoln Labs(麻省理工学院林肯实验室)、the Institute for Far Distance Communications (Leningrad, USSR)(苏联列宁格勒的远程通信学院)和the Institute for Information Transmission Problems of the Russian Science Academy (Moscow, Russia).(在莫斯科的俄罗斯科学研究院成立的信息传播问题的研究小组)。
语音识别技术正在等候一份历史性的鉴定报告。迄今为止,在这一课题上鲜有信息的收集和文章的发表。已经很难知道第一个对语音自动识别感兴趣的人是谁,也不清楚谁在语音方面的研究是关键点。一般人们认为列宁格勒大学的L.L.Myasnikov教授是这一领域研究的第一位俄罗斯科学家,他在19世纪30年代末期完成了语音识别的研究。
语音识别技术还没有发展到像由Stanley Kubrick导演的电影《2001太空漫游》(1968年)中描绘的程度。1992年制造的电脑HAL9000能够维持长期的完美对话的能力,它的语言产生和感知能力远远比当时普通的可用的系统的性能强大。但是当高科技市场孕育出国际公认的权威时,这一技术已经达到了成熟点。这些权威有IBM、Nuance和SpeechWorks(语音工程国际公司),最近,Microsoft(微软公司)通过将其语音服务器带入市场也加入了权威的行列。微软公司的服务器据称可从本质上增加提供全天候服务的呼叫中心的工作效率。
致力于市场战略分析的中介机构如Gartner Inc(嘉纳公司)、the Kelsey Group(凯尔西集团)、Cahners In-Stat Group(顾能集团)、Giga Information Group(吉加资讯集团)和 IDC(互联网数据中心)提出了关于语音识别和语音合成技术发展的多方面预测。来自Gartner Inc(嘉纳公司)的分析师指出:“有个别迹象表明语音识别产业已达到成熟,许多执行过程证实:利用语音识别解决方案能够制造商业价值。” 这些公司预测的2005年全球语音服务行业的收入十分可观,Cahners In-Stat Group 预测为16亿美元,IDC为35亿美元,而The Kelsey Group则为 163亿美元。 语音识别软件的销售量在2000年为一亿美元,Giga Information Group(吉加资讯集团)预计这一数值到2005年将上涨到25亿。Gartner Inc(嘉纳公司)则预言2005年全球仅TTS(文语转换技术)软件的销售量将上涨至60亿美元。
不久以前,人工智能作为科学的一个分支,并未引起企业界大亨和商业资本家,甚至包括投机资本家的关注。 因为它做了很多的允诺,但真正实现的却很少。只有见闻广博的微软公司首席软件工程师比尔•盖茨,一直坚持语音识别和语音合成软件的前景探索。他向商业界传递了关于人工智能的两条信息,一条指出:计算机的处理能力主要用于语音识别、语音合成、字体识别工具和各种各样的服务性应用软件。另一条信息则说到:“人工智能可以帮助我们创造更加简单的使用界面……我们需要未来的软件去听、看、思考,了解使用者的环境、意图和目标。”相较而言,后一条信息更为重要,正如许多商业人士近期的观点:人工智能并不适用于正式的商业谈判。

查看评论 已有0位网友发表了看法
  • 验证码: