您的位置:首页 >新闻 > 热点新闻 >

“当一个伟大的梦想出现的时候,你要马上抓住它!”

人工智能之四:

 

人类的语言、文字,千千万万,不同语言的人之间,不懂得对方语言,一般是很难交流的。如果靠第三者,懂得两种语言的人来当翻译,这也很麻烦。任何人懂得非母语的第二种语言一般是要经过很长时间的专门学习,还要经过种种考试、取得资格。如果语言翻译能用机器来做,就可以省掉这些麻烦。那么机器翻译能做到了吗?不错,现在已经有了很大的进步,例如英翻中、中翻英就比较容易做到了,但其他语言就不一定行。我们希望将来的手机能有无限翻译的本领,如果你有了这样功能的手机,到任何一个外国,你可以问话,别人听不懂,你就对手机讲话,手机就能翻成当地语言,解决问题了。但是世界上语言千千万万,要把很多语言的翻译都装进一台机器里,不是不可能,而是有没有必要。这里说的是语音翻译,肯定先要进行语音识别。把语音变成文字。机器再进行文字翻译,如果要输出语音,就要再经过语音合成、再输出。又比如是一张纸面的文字,可以先拍个照,进行文字识别,再做翻译,这些例举的多种人工智能课题,小部分已经实现,其他将来也可能实现。我们正处在人工智能发展的鼎盛时期。

作为人工智能之一的“机器翻译”也是上世纪80年代才开始研究的。其实这项任务很不简单,如果你以为,机器里存放一个双语字典,查到原词,就能找到对应的另一种词。一句话、一篇文章,逐字查找对应词,就成了吗?其实,这样“翻译”出来的文字是“惨不忍读”的!

原来除了词汇的不同,人类不同语言还有不同的语法、词法,是非常复杂的。比如日语,它用了许多汉字,任何没学过日语的中国人拿起一篇日语文章,粗一看,也能看懂几个字,其实是不知所云,仔细分析,原来日语有一套和汉语完全不同的语法,加上几十个“假名”组成许多实词或助词。它每句话必然是按主语、宾语、谓语排列的(谓语在最后)。而且主语、宾语后必跟有一个助词,谓语后还跟着几个表示时态的假名助词。它的汉字解释也跟汉语不一样(例如日语中“勉强”一词是“学习”的意思)。比较起来,汉语是世界上最简洁的文字,汉语动词的过去时不在原词上作变化,只在句尾加“了”字,如“我吃了”,

“就”字表示将来时,“我就去”表示“将要”去(将来时)。“已经”表示过去完成时,如“我已经读过了”。

要说到俄语,更令人头疼了,一个名词有12种“格”的变化(六种单数加六种复数),动词要变位,在你、我、他,我们、你们、他们,后面跟着的动词都不一样,过去时和现在时也不一样。你想,烦不烦。西方国家大多数用拉丁字母,可是语言文字很不一样,英语的语法相对简单些,但我们读英语要念许多语法规则,够头疼的了,而其他西方语言都更复杂,比如说,大多数西方语言动词有变态都有词尾的变化,跟在我、我们、你、你们、他、他们(她、她们)后面的动词要变位。所以,你想要做好一个机器翻译系统,要准确遵守这些语法规则不是件简单的事。

80年代,“机器翻译”是初创时期,我们开始做英-汉翻译,首先一部完整的双语字典是必要的,这就要花费了巨大的人力来建立字典库,为机器翻译用的字典不同于普通词典,还应增加一些语义、上下文规则,一个词条很可能有多个解释,不应该总是选第一个解释,什么情况用第二、第三个解释,就要根据不同的上下文的词义来决定。所以说,就是要建立一个适合于机器翻译用的字典是非常复杂的,这比了仅仅编一本普通字典要复杂得多。再比如说,英语“a book”,一本书,翻成中文时必须加量词“本”,可是中文的量词少说也有40-50种,那么要一本翻译用的双语字典,必须将所有中文名词是用什么量词的信息标注出来,这难道不是一项十分繁琐的工作吗?后来我们知道了,科学院语言所组织了庞大的队伍在进行机器翻译的工作,光是输入字典数据的操作员就有好几十人,坐满了一间大房间。我们小小的自动化系《语言文字信息处理研究中心》是没有能力去这样做的。

我们知道,英语等大多数西方语言是分词有空格连写的,而汉语句子是字、词连写,直到句子完了才有标点符号,结束一个句子,例如一句话:“我今天早晨去饭厅吃早饭。”翻译成外语时,先要切分为:“我 今天 早晨 去 饭厅 吃 早饭 。”变成七个单词,然后逐个进行翻译。遇到一词多义和切分有歧义时,要分辨多疑、排除歧义更是十分复杂的事,在此不一一细讲了。

我们自动化系于上世纪80-90年代先后有二十多位硕士生和两位博士生作了机器翻译的实践,做过的题目有英汉、汉英、日汉、法汉、葡汉等。90年代的数码相机已经有很好的性能,有一位研究生就选题“能翻译的数码相机”的

题目,让数码相机对准汉字拍照,进行翻译成英语,实现了机器翻译。我们可以期望,今后的智能手机上能有更多的翻译功能,当然还有待更多的研究和集成。

机器翻译肯定还会和语音识别和语音合成结合起来,可以实现更复杂的智能机器,将来的机器人能听懂某种语言,又能翻译成另一种语言输出可以服务于海关、机场、宾馆、商店等等。

“没有做不到的,只有想不到的”。我们可以期待,更完善、功能更强的人工智能机器就会陆续不断地出现在我们的周围,甚至服务到我们的家庭。

最新动态
相关文章
跨村联建产业园 推动文旅融合规范化促...
各路豪杰抢滩气泡水市场 各品牌谁能笑...
原材料价格持续上涨 汽车零部件企业能...
我国共有4.6万家保险经纪相关企业 保险...
核桃编程频繁电话 短信骚扰用户被多次...
小电科技2020年净利亏损1.1亿元 分销费...