五二小说网

手机浏览器扫描二维码访问

四(第1页)

banner"

>

因为“黑箱”

难题,我和莫妮卡关于机器翻译的研究一个学期不到就碰了壁。

起初一切还很顺利。

我们分析了二十世纪的几种商业翻译软件,这些软件的原理大多很简单,连我也能理解。

无非是先将一个句子拆解成一个个词组,再根据辞典把这些词组翻成目标语言,然后根据目标语言的句法规则将词组重新组合,就得到了翻译的结果。

这种方法对于简单的句子尚且可行,但用它翻译一些习语时,总是免不了要闹笑话。

因为目标语言中可能并没有类似的表述。

对此,一些翻译软件开发者想了一些对策,比如说为专有名词、习语和固定的表达方式建立语料库,软件进行翻译时会先检索语料库中是否有匹配的内容。

这样的做法的确让翻译的准确度和流畅性都有所提高,但是,词义消歧仍是一个难题。

特别是当一个词在源语言和目标语言中并不等价的时候,就会引出很多麻烦来。

一个最常被举到的例子是英语的“sheep”

和法语的“mouton”

在英语里,“sheep”

指的是绵羊,而法语的“mouton”

不仅可以指“绵羊”

,也可以指“羊肉”

(英语中的mutton),两个词并不等价。

为了检验一个翻译软件是否能有效地消除歧义,我会设计一个包含类似“mouton”

这样的单词的法语句子,让软件生成英语的译文。

那些采用最传统原理的软件几乎只会把“mouton”

翻成“sheep”

,而并不会考虑语义是否恰当。

所以,有开发者设计了一套统计学方法来消除歧义。

比较常见的方法是:先制作两种语言的平行语料库,然后进行统计,从而发现“mouton”

和草地、牧羊犬或羊毛等词一起出现时,一般要翻译成“sheep”

;而与表示吃或烹饪的动词出现在一起时,则要翻译成“mutton”

之后莫妮卡又分析了一些二十一世纪初的机器翻译软件。

有些软件使用了大量的统计学方法,通过隐变量和对数线性模型来实现翻译(这些术语都是莫妮卡告诉我的,我也不确定自己的表述是否准确)。

这部分的工作我几乎没有参与。

她试图教会我线性代数的基本知识,我也努力了一番,不过最后还是放弃了。

有一天,她把伦敦大学的一位讲师请到了会议室,向她请教了一些高维空间中的线性不可分问题。

而我能做的,只是站在一边泡红茶罢了。

热门小说推荐
恶毒女配在修仙大佬坟头蹦

恶毒女配在修仙大佬坟头蹦

一觉睡醒,纪千漓穿成了团宠小师妹的对照组怨种大师姐。纪千漓散尽修为,退出宗门,改做音修!一曲菊次郎的没挺过夏天震惊修仙界。两首菊次郎的头七拿下修仙界。再来菊次郎的重生直接飞升。昔日同门跪求原谅。纪千漓一条龙服务,吹到师兄弟的头七。团宠小师妹哭求回头。纪千漓吹起唢呐,在小师妹坟头蹦迪。魔尊裴无殇表示干的漂亮。修仙界形势大好,大魔头带着纪千漓,过上了没羞没臊的生活。...

高天之上

高天之上

我根本不关心这个世界的人活的怎么样,吃的饱不饱,能不能穿暖住好,有没有梦想希望。我不在乎他们的爱憎。只是如果想要前往高天之上,需要一个完整的高等工业体系,一整套相关研究所,最先进的材料学实验室和一个能统筹一切部门的大政府。它要无数衣食无忧的国民为此奉献财富,需要几百万个高等知识分子为此贡献自己的头脑,数万不同的配套厂家供应最好的零部件。总之,需要一个富足的世界,一个伟大的文明才能完成它。...

召唤玩家,全民修仙

召唤玩家,全民修仙

方觉一觉醒来,发现自己穿了。坏消息是他穿到了兽人大陆,兽人一个快有他两个大,而且他被当成亚兽,马上要被抓去生娃。好消息是他多了个穿越必备金手指召唤玩家!想回到自己世界,可以啊!先成神。方觉我amp!...

尊主你又掉马甲了

尊主你又掉马甲了

尊主你又掉马甲了是穆丹枫精心创作的言情小说,实时更新尊主你又掉马甲了最新章节并且提供无弹窗阅读,书友所发表的尊主你又掉马甲了评论,并不代表赞同或者支持尊主你又掉马甲了读者的观点。...

每日热搜小说推荐