日本机器翻译第一人长尾真逝世!首个提出基于实例的机器翻译方法
日本机器翻译第一人长尾真逝世!首个提出基于实例的机器翻译方法
整理 | 陈彩娴
编辑 | 刘冰一
消息:5月23日,日本知名自然语言处理学者长尾真(Makoto Nagao)教授因不小心摔了一跤,在日本家中去世,享年85岁。
长尾真教授是日本机器翻译研究的第一人、国际自然语言处理研究的先驱,在促进中日交流方面做出了巨大贡献,先生千古!
据维基百科介绍,长尾真教授在1936年10月出身于日本三重县,本硕博均就读于京都大学电机系(分别毕业于1959年、1961年与1966年)。随后,1967年,他加入京都大学担任助理教授,1968年升为副教授,1973年成为教授,1997年成为京都大学第23位校长、并任职至2003年。
2003年从京都大学退休后,长尾真被日本国立信息通信技术研究所聘为所长,任职至2007年,之后又加入日本国会图书馆担任馆长,任职至2012年。
凭借出色的研究成果,长尾真在1993年被授予IEEE Emanuel R. Piore奖、1997年获得国际机器翻译协会荣誉勋章、2003年获得ACL终身成就奖等等荣誉。他也是亚太机器翻译协会(AAMT)第一任主席。
长尾真教授在NLP上影响最深远的,是其上世纪80年代早期首次提出基于实例的机器翻译方法,开拓了机器翻译研究的新方向。
1984年,他发表了《采用类比原则进行日-英机器翻译的一个框架》("A framework of a mechanical translation between Japanese and English by analogy principle")一文,探讨日本人初学英语时翻译句子的基本过程。
长尾真指出,人类并不通过做深层的语言学分析来进行翻译,人类的翻译过程是:首先把输入的句子正确地分解为一些短语碎片,接着把这些短语碎片翻译成其它语言的短语碎片,最后再把这些短语碎片构成完整的句子,每个短语碎片的翻译是通过类比的原则来实现的。因此,我们应该在计算机中存储一些实例,并建立由给定的句子找寻类似例句的机制,这是一种由实例引导推理的机器翻译方法,也就是基于实例的机器翻译方法。
在基于实例的机器翻译系统中,系统的主要知识源是双语对照的翻译实例库,实例库主要有两个字段,一个字段保存源语言句子,另一个字段保存与之对应的译文,每输入一个源语言的句子时,系统把这个句子同实例库中的源语言句子字段进行比较,找出与这个句子最为相似的句子,并模拟与这个句子相对应的译文,最后输出译文。
基于实例的机器翻译系统中,翻译知识以实例和义类词典的形式来表示,易于增加或删除,系统的维护简单易行,如果利用了较大的翻译实例库并进行精确的对比,有可能产生高质量译文,而且避免了基于规则的那些传统的机器翻译方法必须进行深层语言学分析的难点,在翻译策略上是很有吸引力的。
此外,1982年至1986年,长尾真在Mu机器翻译项目上发挥了重要作用。这是一个基于迁移模型的翻译系统,用于翻译自然科学领域的技术论文摘要,是世界上第一个成功实现日语与英语互翻的机器翻译系统。要知道,日语与英语的语法结构完全不同,机器翻译的实现难度可想而知。
长尾真教授致力于日语语言技术与方法的创新。上世纪90年代初,他开发了名为“JUAMN”的日语词法分析工具。日语的拼写无法百分百标记单字边界,词法沾着,而JUAMN是第一个能够与日语分割与词法分析结合在一起的工具包。他的工作能够同时进行日语单字分割、词法分析与POS标记。JUAMN的准确率达到95%,鼓励了许多基于相同原理的系统开发,有些系统甚至达到98%的准确度。
除了JUAMN,1994年,长尾真教授与Sadao Kurohashi(现任日本京都大学教授)开发了一种基于依赖项的语法解析器,名为“KNP”,特别适合日语之类的单字自由语言。
在数字图书馆方面,长尾真教授参与贡献开发的Adriadne系统对日本乃至全世界数字图书馆的研究与开发产生了深远影响。在数字图书馆研究中,他提升文档内容之间与内容内部的索引方面用到了NLP技术。
参考链接:
赠书福利
本次联合【博文视点】为大家带来10本 《联邦学习实战》正版新书。
在AI科技评论微信端5月23日二条《杨强教授新书重磅出炉!揭秘联邦学习如何在视觉等领域应用实践》(注意不是本文)留言区留言,欢迎大家畅所欲言,谈一谈你 对本书的看法和期待或者在学习图神经网络时遇到的困难。
AI 科技评论将会在 (5月23日)微信端二条留言区选出 10名读者,每人送出 《联邦学习实战》一本。
由于微信公众号试行乱序推送,您可能不再能准时收到的推送。为了第一时间收到的报道, 请将“”设为星标账号在看”。
绯色流星攻略 http://www.cityruyi.com/lm-4/lm-1/3053.html
- 标签:橙子在线
- 编辑:王智
- 相关文章
-
日本机器翻译第一人长尾真逝世!首个提出基于实例的机器翻译方法
日本机器翻译第一人长尾真逝世!首个提出基于实例的机器翻译方法 整理 | 陈彩娴 编辑 | 刘冰一 消息:5月23日,日本知名自然语言处理…
-
2021全球Top 1000计算机科学家h指数发布,中国53人上榜!Bengio总榜第二,韩家炜居华人首位
2021全球Top 1000计算机科学家h指数发布,中国53人上榜!Bengio总榜第二,韩家炜居华人首位 作者 | 陈大鑫、琰琰 近日(5月10日), Guide2…
- OPPO高层被迫道歉,辱骂鸿蒙引粉丝骂战,国产厂商合作成幻想?
- 中赫时尚“特别教室”特别在哪里?发展前景有多大?
- 鸿蒙2.0发布前的黑暗,各大厂商放烟雾弹,是谁在刻意捣乱华为?
- 王者荣耀猪队友,游戏更新曝光华为新平板,直接搭载鸿蒙2.0?
- 三星手机没人用?王者荣耀更新超高帧率成摆设,用户还被骂是异类