基于注意力机制的神经网络机器翻译文献综述

 2021-10-28 20:31:00

毕业论文课题相关文献综述

文 献 综 述一、研究背景与意义:早期的机器翻译比较依赖于人类专家的规则制定,后来在处理一些拥有平行语料库的语言时候,有了基于数据驱动的机器翻译,也就是利用不同语言之间的对应关系来进行翻译,让计算机在数据中挖掘翻译知识来实现翻译,可以通过引入概率模型来进行翻译。

主流的方法有以隐结构短语为基础的短语翻译模型,也就是将单词切分成短语,再按照语序调节顺序实现翻译。

机器翻译在隐变量上建立模型的主流方法是对数线性模型,利用特征权和特征函数来控制隐变量。

统计机器翻译的好处是隐形结构对内部的解释度高,用局部的特征和动态规划处理指数级结构空间,缺点是作为一个线性模型难以处理非线性的情况,而且需要人类专家设计隐性结构相应的翻译过程,也就是对翻译的调序不一定准确。

在国内,许多大学和研究机构开发了俄语,汉语、英语和日语的相互机器翻译系统。

同时看到机器翻译研究的进展,因为缺少了人为制定的规则和语法规则,以及计算机本身的限制,再加上不同语言的语法结构和句子表达方式的差异性比较大,机器翻译的效果不是令人满意。

但是随着智能算法以及新技术的兴起,机器翻译的准确程度也在不断提高,在这个阶段,机器翻译的作用更像一个先进工具,在不断优化的同时,也在寻求其他的运用场合。

二、国内外研究现状:神经机器翻译目前主流的方法有以隐结构短语为基础的短语翻译模型,也就是将单词切分成短语,再按照语序调节顺序实现翻译。

基于深度学习的机器翻译方法主要的思想就是:端到端,个人理解就是输入输出的对应关系,主要是利用神经网络实现自然语言的映射,不引入隐变量,而是通过源句子和已经生成的目标语言句子来预测下一个词或者短语,条件概率模型也用连续来代替离散的,其技巧在于利用向量,也就是源语言的上下文和目标语言的上下文来作为所谓的稠密向量。

在深度学习在自然语言处理领域的成功应用的背景下,2013年,英国牛津大学Kalchbrenner等人[1]提出了基于向量表示的神经机器翻译。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。