欧洲一些语言称不上是独立的语言,顶多就是
一个完全不懂意大利语的人,只要你懂英语。应该很快就能学懂意大利语,就是发音不一样,甚至有些读音都很相似。
X是英语,蓝色是意大利语X是英语,Y是意大利语,猜猜英语中cat对应于那个意大利语。
虽然我不懂意大利语,但是如果让我连连看,我应该很快就连出来了。来测试一下,你看行不行。
比如上面的cat,对应于意大利语里面的gattto,多年几遍,读音字形都像,都含有at。
deep映射到profondo,英语中有个单词profound也是深刻的意思,字形读音和意大利语profound都像。
feline,猫一样狡诈的,意大利语felino,就差一个字尾。最后一个字母,一个是e一个是o。
car,意大利语auto,就是一词多义。事实上,你说auto英国人都知道是汽车。
看看你连对没有其实欧洲的许多语言都具有这样的特性。法语,德语,英语,意大利语,西班牙语等拉丁语系语言,都能通过连连看来实现单词之间的匹配。只要你懂的英语,稍微懂一点儿这些语言,就能蒙个八九不离十。
所以我说欧洲的这些语言,大体上相当于我们中国的各地方言。这得感谢我们的老祖先,始皇帝,高瞻远瞩。
始皇帝千古一帝他让我们的各个方言,在两千多年前,就统一了书写形式。马云先生现在只需要会写一个马字就可以到各国做生意了。而不需要在名片上同时印上秦,齐,楚,燕,韩,赵,魏七种写法的马。
不同的马字而欧洲各国长期以来并没有实现大一统。由于采用了读音的书写书写方法,造成了各个国家,不但语言不通,而且文字也不同。
这感觉就像你,一个北京人儿,跑到了上海,需要重新学习上海方言一样,你写Xie,上海人非写Hai,你写Ni,上海人非写Nong。只不过我们的汉字是一样的,你只需要鞋,你,就能在全国通行无阻。你只需要重新学习读音。而英国人到意大利,他们不但读音需要学,而且书写方法也需要重新学习。
就着这个话题,额外再谈一点人工智能和机器翻译的事儿。
一说起人工智能,机器翻译大家都觉得很复杂,感觉机器有多么了不起一样。觉得计算机马上就要替代人类了。
两种语言之间的机器翻译说复杂也复杂,说简单也简单。就是利用两种语言之间的一种结构上的相似,把一种语言映射到另外一种语言上去。
机器所需要做的就是找到一个矩阵w。将x集合中的英语单词映射到y集合中的意大利语单词。在这个映射过程中,我们要尽可能地保持意思相近的单词,挨在一起。有了这个矩阵,就相当于我们完成了连连看这个操作。
寻找矩阵W将X变换到Y机器翻译的过程就是寻找这样一个矩阵的过程。找到了这样一个矩阵,就完成了两个语言之间的翻译。
简单一点来说,因为这两种语言同宗同源,同结构。只是摆放位置不一样。所以你只需要把这两种语言旋转一下缩放一下。让他们的单词对到一起。这和小孩儿玩儿的连连看差不多。
如果大家理解了机器翻译的运作过程,就会发现其实机器翻译并没有那么神秘。计算机也并没有真的达到了人的智能,只是学会了连连看。
附录
无监督词翻译词嵌入有很多结构假设:跨语言的结构应该是相似的。
UnsupervisedWordTranslation
WordembeddingshavealotofstructureAssumption:
thatstructureshouldbesimilaracrosslanguages
转载请注明:http://www.abuoumao.com/hyfw/5080.html