笔趣阁

手机浏览器扫描二维码访问

第67章 你们能比我更懂机器翻译5k(第2页)

林燃一副理所当然的样子:“当然,我都和科罗廖夫见了两面,我不会俄语怎么和他交流的?

我同时会俄语、德语、英语和汉语。”

多语言大师的身份,给林燃的理论增添了几分可信度。

在这个时代,科学家们会几门语言并不奇怪。

当然一些敏感部门会提高对你的怀疑。

以前面提到的约翰·麦卡锡为例,他就精通俄语,从小接受俄语教育长大,尽管他出生在阿美莉卡。

“另外翻译过程,应该是模块化设计,而不是简单的映射关系。

它应该分成预处理、翻译、后处理三部分。

预处理包括了分词和词形还原,翻译才是词典的映射,后处理是对语序进行调整。

这样来降低单次计算的复杂度,提高规则的复用率!”

林燃的话给了在座研究团队的成员们非常多的灵感。

就好像之前一直陷在百越的丛林里找不到出路,而现在天上出现一道光指引他们怎么样才能走出丛林迷宫。

大家都有点迫不及待去尝试了。

所有研究人员都疯狂在笔记本上记录下林燃所说的。

虽然不确定教授的方法是否管用,但有路总比之前没有好。

再者,如果你不好好记下来,到时候被开除只是教授一句话的事。

“好了刚才我们讲了一些简单的内容,现在才是最难的。

因为IBM的机器不是那么强大,我们只能引入一些比较简单的统计学方法来提高我们翻译的准确度。

我把它叫做基于频率的词对齐。

这也是我们引入统计模型的核。

我们先要手动分析平行句子,标注俄语词或短语与英语翻译的对应关系。

俄语句子Мыговоримомире

英语翻译:“Wespeakaboutpeace

对齐结果:“мы”

对应“we”

“говорим”

对应“speak”

“о”

对应“about”

“мире”

对应“peace”

然后我们需要对这种对齐的频率进行统计。

统计每个俄语词或短语在英语中的对应翻译出现的频率。

例如,在语料中,“говорим”

在80%的句子中翻译为“speak”

,20%翻译为“talk”

这样对于我们就可以构建概率表了。

将这些概率整理成表格,供机器进行查询。

反贼之路:开局抢了和亲公主!  第四天灾:人在高武,游戏成神  出宫第四年,清冷摄政王夜夜求复合  蓄谋已久,强扭的白月光他又酸又涩  重生后女帝拿了美强惨剧本  奥特曼:开门啊,是我,老人迦!  亡国公主娇又软,糙汉可汗夜夜宠  海贼:从捡到红发断臂开始  平步亲芸  团宠小福星,扛着粮仓去逃荒  我的化身正在成为最终BOSS  三年婚姻守空房,我独美你发疯  请天下赴死  女儿喜欢后爸,我成全他们一家三口  不许没收我的人籍  重生的我只想追小姨子  农门悍媳有空间,嫁猎户被宠不停  换亲后!带火婆家!  文圣天尊  黄金年代从1977开始  

热门小说推荐
太古神王

太古神王

玄幻爽文九天大陆,天穹之上有九条星河,亿万星辰,皆为武命星辰,武道之人,可沟通星辰,觉醒星魂,成武命修士。传说,九天大陆最为厉害的武修,每突破一个境界,便能开辟一扇星门,从而沟通一颗星辰,直至,让九重天上,都有自己的武命星辰,化身通天彻地的太古神王。亿万生灵诸天万界,秦问天笑看苍天,他要做天空,最亮的那颗星辰...

武林店小二

武林店小二

江湖日报讯肯麦郎连锁客栈享誉大明各府,其总部却是京城一家名为来福的小客栈。来福客栈在江湖上大名鼎鼎,即便费用高昂,上到各派掌门下到江湖游侠,都挤破脑袋想去来福客栈吃顿饭。记者有幸请到武林盟主,揭开来福客栈的秘密!来福客栈日常一幕少林方丈,你怎么吃饭不给钱啊?偶弥陀佛,出家人身无分文,这顿饭可否算作化缘?不行!武当掌门没钱吃饭,还在后院洗碗呢!你若不给钱,就去洗茅房!来福客栈日常二幕丐帮长老,瞧你样子就没钱吃饭,你来客栈干啥?听闻来福客栈可以拿东西抵押,我这里有本上乘的秘...

大话之神

大话之神

一个热爱网络游戏的痴孩子,二不垃及的真神祝愿下进入了游戏的世界。。。。。。...

九龙吞珠

九龙吞珠

一张从始皇帝皇宫流传出的长生不老药地图,解开不死不灭之秘。一代名将,将守,从万人敌,到无人敌的重生之路!九龙吞珠读者交流群721466643)...

每日热搜小说推荐