网络环境下的语音辅助翻译软件系统应用目前状况与前景论文

作者:网友分享原创网站原创 点赞:6834 浏览:17638 最后更新时间:2024-03-14
【摘 要】本文就网络环境下语音技术的目前状况、语音与文本间的相互转换、语音技术与机辅翻译系统和机器翻译系统应用的研究状况以及其应用前景进行综合探讨,以期对未来语音技术及机辅翻译系统和机器翻译系统的应用和研究提供参考。
  【关键词】网络;文本;语音;转换;语音识别;应用;前景
  

一、语音技术

  为了提高翻译质量和加快翻译速度,译者通常是倾向于使用有效辅助工具,机辅翻译工作台(综合许多计算机辅助翻译工具)将继续是专业译者的主要翻译辅助工具。除了此之外,语音分析和合成技术的发展也为专业译者的工作提供帮助。在过去,一些专业译者使用“录音电话机”记录翻译的初稿。然后,打印其翻译草稿,然后生成译本的书面版本。目前的“听写”技术是一种语音录入软件,省略了以前的输入工作,具有自动把录音转换成文本的功能。并且还能根据译者的语音指令来创建、编辑、校正和保存翻译文件。这样的设备可以减少听录音和录入的时间,但条件是系统可以识别说话者或终端用户的口音、音调和语气。
  语音录入软件的发展归功于语音识别的进步,计算机识别语音信号(一种既定语言的人类的话语)然后转化成文本的过程。反过来也是可能的——文本也能转换成语音:基于语音合成的从文本到发音的系统。此外,计算机辅助翻译工具,譬如翻译记忆库与语音录入软件同时使用将对专业译者是非常有用,尤其当译者想要或同时运作多项任务,例如一边在利用听写系统软件翻译一个文本的初稿,同时一边运转翻译记忆库,为一个词是短语查找相应的译文。
  

二、研究目前状况

  ,从语音到文本和从文本到语音的技术主要适用于西欧语言,但是少数产品也适用于一些亚洲语言,譬如,印度语和泰语。语音录入软件具有很高的语言特定性——只识别特定的语言(Somers2003:17)。而且,在不同的译者对系统进行训练中发现,该系统只识别特定的语音和口音。很难预言何时语音录入软件将为除了西欧语言以外的更多语言所利用,但是近年来在中国、香港、日本、台湾和美国的研究人员已经开始从事汉语和日语在这方面的研究了。本尼斯(Benis:1999)回顾了早期几代英式英语、法语、德语、意大利语和西班牙语的听写系统。使用这些语言的商业听写系统软件包括包括美国NCH公司的Swift Sound的Express Dictate和荷兰Philips公司的FreeSpeech。
  

三、语音技术与翻译系统

  最近几年,语音技术吸引了自然语言处理研究人员的注意力,尤其是来自加拿大、欧洲、日本和美国的研究人员。他们的总目标是,提供一种在同一语言不同的语言之间能把语音转换成文本、文本转化成语音、以及一种语音转化成另外一种语音的技术。传统上来说,笔译是指基于文本的翻译,而口译则是基于语音的翻译。但是,这条界线已经由语音技术以及屏幕翻译的发展打破了。(Gambier2003)
  译者可以综合利用单音(随时)听写软件和现有的计算机辅助翻译系统来完成某些任务的。同时,译者也可以将语音技术与计算机辅助翻译和机器翻译系统综合起来运用。
  “语音到文本翻译”、“文本到语音翻译”以及“语音到语音翻译”涉及一种语言输出和另一种语言输入的文本与语音对话翻译系统。语音到文本翻译是指把一种语言的语音(原文输入)翻译成另一种语言的书面文本(译文输出)形式,在这过程中,声音信息被转换成书面文本形式,以方便有听觉障碍或马达技能残障人士。语音到文本翻译系统包括IBM公司的ViaVoice以及Dragon NaturallySpeaking,两者都能翻译七种语言。
  对语音到文本技术的最近一项应用就是为那些听障和半听障群体把电视上的语音话语转化成“字幕”。严格的说,这不是一种翻译活动,但是这与口译有着明显的联系。该系统依靠一种语内翻译——一个经过培训的相似度检测体把现场直播的内容进行改述和简化,例如,作为原文输入语音技术软件的新闻节目被简化,并且有意把话语单调化,然后被转换成文本字幕形式(但是仍然有一定数量的错误)。这种限于少数人使用的闭路字幕是文本形式,不仅叙述了电视对白的内容,而且还叙述了相关的声音,譬如,“电话铃声”和“脚步声”,以方便听障人士。观众可以激活这些字幕,有时是用一个特殊的。这项技术也许会很快就能应付现场实时电视转播和电缆/卫星传输。具有这种能力产品可能很快就要面世了,因为已经在网络上做广告了,譬如,由SoftNI公司制造的SoftNI实时字幕系统。
  文本到语音翻译是指把文字文本(原文输入)翻译成语音文本(译文输出),文字文本被转换成语音信息,这主要为了视障人士。文本到语音翻译系统包括,AbhiSoft科技公司研制的能翻译八种语言的Talking Translator Pro和美国电话电报公司实验室研制的能翻译五种语言的Natural Voices?。
  语音到语音翻译是指把一种语言的声音文本(原文输入)翻译成另外一种语言的声音文本(译文输出),从而满足为不同语言国家的说双语和多语的人。语音到语音翻译系统包括,IBM公司研制的MASTOR(多语种自动语音到语音翻译器),用来推动没有共同语言(不会讲同一种语言)的个人之间的交流,和Spoken Translation公司研制的“保健医疗交流平台”(HealthComm Healthcare Patient Communication Platform),用作说西班牙语的患者和说英文的医疗保健工作者之间提供交流媒介。双语多语种语音到语音系统口译人员的功能相似,例如,在彼此不懂对方语言的商业谈判中。当然,文本到文本翻译系统才是常规机器翻译系统。
  

四、语音识别

  涉及到语音与翻译,就一定离不开语音识别。在其早期阶段,语言识别研究焦点是为那些有身体缺陷的终端用户提供非手动制约计算机和其它电子设备的一种单语言系统。后来才研究了关于计算机接受和理解口述指令来执行某些任务的可能性,譬如,在做文字处理的时候删除一个词或保存一个文件。随后,研究活动转向了多语种语音识别,譬如德国的卡内基梅隆大学和卡尔斯鲁厄大学开发的Global-Phone系统,能处理至少15种语言。该系统包含一个由说母语的人录制的政治和经济报纸文章的语音文本数据库。数据库的目的是要大量的词汇来训练和测试语音识别系统,让其不受说话人限制。欧洲语言资源学会和语言数据联盟可以获得更多的语音语料库录音数据库。这些语科库包括至少十种语言的录音语音数据和发音词典,以及至少二十种语言的文本语科库(Somers:2003b:7)。