搜狐网站lenovo奥运频道-搜狐奥运

不懂中文也无障碍 奥运期间多语言提供信息服务

https://2008.sohu.com 2007年09月10日19:08 新华网

我来说两句
  (俞铮杨樱)一位来自美国纽约扬基棒球队球迷要从下榻的市中心酒店去城西的五棵松棒球馆看奥运会比赛。他用从美国带来的国际漫游移动电话,拨了一串号码,接着询问从酒店到棒球馆的路线以及交通状况,数秒钟后,一个机器模拟的迷人女声用标准的英文告诉了他所需要的详细信息。


  在2008年8月北京举办奥运会期间,任何一个不懂中文的国外游客都能享受到上述服务。电信运营商和相关研发团队正致力于建立一个海量信息检索平台,该平台最终可能实现在中、英、法等六种主要语言间的自由切换。

  该项技术的主要研发者之一潘接林10日在接受新华社记者采访时说:“电信服务商的网络搭载我们开发的嵌入式设备后,北京将成为世界上第一个大规模向国外游客提供多语言智能信息服务的城市。目前技术已经成熟,相关服务将在北京奥运会期间得以实现。”

  游客除了可以通过固定电话和移动终端获得这项服务,也可以通过新安装在北京主要街道沿线的信息亭查询交通、天气、旅游、餐饮等所有与奥运会相关的信息。

  “多语言智能信息服务系统”是一个面向奥运会场馆内外,基于宽带网络支持,以多语言智能信息处理平台和海量数据库为核心,由数以百计固定与移动的多语言服务智能体组成的大规模分布式网络系统。用户可以通过计算机、移动电话、固定电话、信息亭、移动终端等多种方式进行访问和交流。

  北京市旅游局发布的数据显示,在为期两周的奥运旅游高峰期,北京将接待至少55万名国外游客,与此同时,国内游客数量将达220万。

  中国科学院声学研究所中科信利语音实验室副主任潘接林说:“我们开发的嵌入式芯片目前只能支持中、英文两种语言。不过,法语、德语、西班牙语、阿拉伯语等将很快加入进来。”

  实验室开发了嵌入式多语言语音识别引擎。该引擎可以自动筛选人话语中的声学特征,把声音信号转化为字节,并以字节的形式把语音数据与语料库中保存的数据相比对,最后通过算法处理优选出与接收到的话语最匹配的意思。这一复杂程序在极短时间内就得到处理,询问者几秒钟后就能从系统得到回应。

  潘接林说:“假如能获取足够多的语料库,我们的语音识别核心技术对于任何语种来说都一样有效。”

  实验室技术总监赵庆卫说:“我们在汉语语音识别方面具有很强的竞争力,甚至开发出包括粤语在内的汉语方言语音识别系统。”而实验室的英语口语语料库则是从美国公司购买的,目的是为了确保英语发音纯正,以提高系统的识别率。

  赵庆卫当场向记者演示了语音识别系统识别并记录《新闻联播》的情景。随着播音员播报出某日的一段新闻内容,系统连接的计算机屏幕上几乎实时地记录下了对应的文字。

  赵庆卫说:“系统对于识别用标准普通话的朗读已经达到了世界领先水平,但对记录口语化的日常对话还有一定困难。我们对限定范围内语言的识别技术很有信心,在诸如道路交通信息、奥运比赛结果、奥运场馆信息和天气情况等方面,语音识别准确率可以达到90%以上。”

  目前,实验室正致力于提高语音识别准确率和减少噪音对正确识别的影响。他们开发的减噪技术能显著提高对于在飞行或者其他强噪音环境下对话的识别质量。

  中科信利语音实验室已与北京奥运会独家授权的多语言系统服务商——首都信息发展有限公司签订了协议,将为北京主要街道的信息亭和各大电信平台配备中、英文语音识别引擎。

  电信运营商中国移动已在移动电话彩铃下载服务平台运用了语音识别的新技术。想下载心爱乐曲,却苦于不知名称的用户,只需拨打一个号码,并向移动电话话筒里轻哼任意一段旋律,就可以即刻找到他们想要的乐曲。

  “同中国移动的合作预计可以取得较好的经济回报。”潘接林说。

  商业化的语音和音乐识别技术也在KTV厅等娱乐场所得到应用。一些城市的KTV厅已经安装了音乐搜索引擎。歌唱爱好者可以对着话筒唱一小段,系统就能自动搜索出最接近所唱旋律的歌曲。

  潘接林说:“除了完成与奥运相关的项目,我们非常愿意应用成熟的新技术为普通人的生活服务。”

(责任编辑:老满)

用户: 匿名发表: 匿名发表:

*用搜狗拼音输入法发帖子,体验更流畅的中文输入>>

设为辩论话题 

精彩推荐

奥运图库