手机浏览器扫描二维码访问
林燃一副理所当然的样子:“当然,我都和科罗廖夫见了两面,我不会俄语怎么和他交流的?
我同时会俄语、德语、英语和汉语。”
多语言大师的身份,给林燃的理论增添了几分可信度。
在这个时代,科学家们会几门语言并不奇怪。
当然一些敏感部门会提高对你的怀疑。
以前面提到的约翰·麦卡锡为例,他就精通俄语,从小接受俄语教育长大,尽管他出生在阿美莉卡。
“另外翻译过程,应该是模块化设计,而不是简单的映射关系。
它应该分成预处理、翻译、后处理三部分。
预处理包括了分词和词形还原,翻译才是词典的映射,后处理是对语序进行调整。
这样来降低单次计算的复杂度,提高规则的复用率!”
林燃的话给了在座研究团队的成员们非常多的灵感。
就好像之前一直陷在百越的丛林里找不到出路,而现在天上出现一道光指引他们怎么样才能走出丛林迷宫。
大家都有点迫不及待去尝试了。
所有研究人员都疯狂在笔记本上记录下林燃所说的。
虽然不确定教授的方法是否管用,但有路总比之前没有好。
再者,如果你不好好记下来,到时候被开除只是教授一句话的事。
“好了刚才我们讲了一些简单的内容,现在才是最难的。
因为IBM的机器不是那么强大,我们只能引入一些比较简单的统计学方法来提高我们翻译的准确度。
我把它叫做基于频率的词对齐。
这也是我们引入统计模型的核。
我们先要手动分析平行句子,标注俄语词或短语与英语翻译的对应关系。
俄语句子Мыговоримомире
英语翻译:“Wespeakaboutpeace
对齐结果:“мы”
对应“we”
“говорим”
对应“speak”
“о”
对应“about”
“мире”
对应“peace”
然后我们需要对这种对齐的频率进行统计。
统计每个俄语词或短语在英语中的对应翻译出现的频率。
例如,在语料中,“говорим”
在80%的句子中翻译为“speak”
,20%翻译为“talk”
。
这样对于我们就可以构建概率表了。
将这些概率整理成表格,供机器进行查询。
反贼之路:开局抢了和亲公主! 平步亲芸 海贼:从捡到红发断臂开始 黄金年代从1977开始 蓄谋已久,强扭的白月光他又酸又涩 换亲后!带火婆家! 我的化身正在成为最终BOSS 农门悍媳有空间,嫁猎户被宠不停 请天下赴死 重生后女帝拿了美强惨剧本 三年婚姻守空房,我独美你发疯 奥特曼:开门啊,是我,老人迦! 女儿喜欢后爸,我成全他们一家三口 不许没收我的人籍 第四天灾:人在高武,游戏成神 重生的我只想追小姨子 团宠小福星,扛着粮仓去逃荒 亡国公主娇又软,糙汉可汗夜夜宠 出宫第四年,清冷摄政王夜夜求复合 文圣天尊
甜宠无虐+日更+萌宝+智脑一个大佬和重生来的小媳妇甜蜜日常!一个娱乐小透明凭借智脑逆袭成超级影后的故事~...
一朝重生,亲爹从军阵亡,亲娘病死,留下体弱的弟弟和青砖瓦房几间。无奈家有极品亲戚,占了我家房还想害我姐弟性命!幸得好心夫妻垂帘,才有这安稳日子过。偶然山中救得老道一位,得其倾囊相授修得一身好武艺。骤闻亲爹消息,变身潇洒少年郎,入了天下闻名的孟家军,立军功当将军,可是那个总阴魂不散的小王爷是要搞哪样?虾米?威胁我?...
玄幻爽文九天大陆,天穹之上有九条星河,亿万星辰,皆为武命星辰,武道之人,可沟通星辰,觉醒星魂,成武命修士。传说,九天大陆最为厉害的武修,每突破一个境界,便能开辟一扇星门,从而沟通一颗星辰,直至,让九重天上,都有自己的武命星辰,化身通天彻地的太古神王。亿万生灵诸天万界,秦问天笑看苍天,他要做天空,最亮的那颗星辰...
...
...
最强系统,我就是最强!还有谁?叶风看着众多的天骄,脸色淡定无比!获得最强系统,经验可复制对方的功法神通,可升级功法神通品阶无所不能,唯有最强!碾压苍穹,打爆世间一切不服者!...