英语翻译软件视角下的翻译改正算法研究

卢**

实名认证

店铺

DOCX

14.89KB

约4页

文档ID:169712239

1/4页

点击查看更多>>

文本预览下载提示常见问题

英语翻译软件视角下的翻译改正算法研究摘要：本文从呼应、替代、省略、连接四种语法衔接伎俩探讨了英汉语衔接伎俩的差别以及调整英译汉语法衔接伎俩的常用翻译办法英汉语法机制差别突出体现在形合与意合的问题上，两种语言间的差别经常成为翻译的障碍语法衔接机制发生冲突时，为了维持语篇的连贯性，有必要根据译入语的衔接原那么调整衔接模式　　机器翻译是属于自然语言翻译范畴的核心局部，通常具有较高的社会应用价值机器翻译也是属于一种英语语言文学翻译办法，不过该办法还是凭经验进行译文，它不需要对句子的语法与语义进行更深入了解与分析，就能提升英翻译的效率[1]但是由于该翻译措施对实例库要求比拟严格，而传统的机器翻译一般是运用管道形式逐次运作对最初语料采取词性标识与句子语法分析，从而形成英语句子与语法结构，使得英语翻译过程中出现错迭代传递增多与结构化实例发生错误的情景大大提高，最终使得英语语言文学翻译的错误率也随之提升为了解决这方面难题，因此本文从英语翻译软件视角下对翻译改过算法进行详细探讨，最终目的就使英语语言文学翻译的准确率得到提高[2] 　　1依存树到串模型与相关计算　　1.1依存树到串模型分析　　三元组属于依存树到串模型，当中是一个翻译对。

在此模型中，D的含意为源语言的依存树，S的含意为源语言的目标词语串，A的含意主要用来对D和S两者之间的词对齐关系的描述，根据依存树到串双语对齐模型的实例[3]上端是源语言的依存树D，D的每个节点主要包括词性与词语两个属性，各词语下的英文代表各单词相应的词语性质示例动词、名词、形容词通常分别用VV、NN、以及JJ所表示此文的词性标注规范来源于StanfordParser词性标注集)单词中还采用黑色线段一般是用来对词语相互之间的关系进行描述下端时是中文句子所对应的英文字符串序S,上端与下端的虚线的作用主要对汉语单词节点与英语单词两者之间的对应关系进行描述[3] 　　1.2知网的词汇语义相近程度　　近似度的取值范围一般为[0，1]，W1与W2两个不一样的词语之间的含意的近似度为：(,)(,)sinsemanticW1W2maxi1,2,n,j1,2,,ms1is2isim=L=L=(1)在(1)式中s1i(i=1,2,L,n)与s2i(i=1,2,L,m)主要用来对对Wi与W2两个词语中所存在n个与M个概念进行阐述，两个词语中所叙述的含意近似度是两个词语的概念近似最大值词语定义的近似度可以使用定义的义原相近的程度进行表述，使用如下(2)式的运算义原p1与p2的近似度。

αα+=dSim(P,P)12(2)在(2)式中，α代表能够调控的参数，d代表两个义原在义原树中的路径距离，它的数值通常为0或者正数　　1.3对数线性模型　　对于该模运用多特点的思考辨认模型依据一个若的句子：ffffIjJJI=L,L，形成设文eeIejeJJI=L,L,，最大的熵的翻译模型如下：(,)1eheeJIJmIMmmJI∑==λ(3)对数线性模型可拓展性比拟强，能够依据不同的目标要求对对应特点进行设定，还能够把数种不同的语言学措施应用到机器翻译中来机器翻译系统的主要表现方式为正向译文概率、反向译文概率、以及译文语言模型等特征函数立足于翻译系统的实际要求自动设置特点函数与相应的特权权重，再参照上式(3)就能够得到对形成译文得分最高为最正确译文[4] 　　1.4机器翻译系统分析　　运用Sato&Nagao措施分析依存机构，将依存树到串对齐实例的源语言依存树进行它的表现方式进行论述，再经配套论述的方式对实例库内的实例片段进行测试，从而获得所需要录入的句子，相近的实例测试得到完成配套体现的叙述方式通常为三种形分别为增加、过滤、以及替换在未有目标语词串中，该目标语词串主要指依存树架构关系层，它相对应的翻译出来的语句表现形式也将发生改变[5]。

　　源语言的依存树到串实例D3与实例D5在实例库的结构源语言的依存树到串实例D3与实例D5在实例库的结构展现在实际库例中，比方类似于e21、e51的标识，一般是采用单词的顺序对其实施标号，S(目标词语串)的标号是在前面标识了“e〞比方将中文“她买了一本英语书〞，再与源语言实例D3与D5相互融合，通过测试而取得[c21,[r,c23[c51]]]是属于它当中一个相对应的表现形式，经过此目标配套表现形式获得录入语句的目标语译文是Ibuyapoliticsbook 　　根据该文对数性模型，采用特征函数具体表现如下：(1)正向译文概率与反向译文概率，倘假设单词量一样时，两种句子(即译句与被译句)之间具有较多一样的单词量，如果使用特征函数就更加容易形成比拟正确的翻译2)语言模型倘假设要形成高质量的译文，通常是就要使用这种函数来进行考核，提升译文句子流利、顺畅程度此文以目标语言的语言模型，得出目标语言中所包含的译文片断的概率　　2相关试验　　2.1试验设定　　试验语料使用是CWMT2022官方测评用的汉英新闻语料，由于受到实验系统限止，从中挑选出42万句语料，当然此语料也是属于英语与汉语的平行语料，把这些挑选出来的语料看成为英汉双语实际应用库例中的初始语料[6]。

把CWMT2022国家测试集看成检测集，语言栏是指检测的句子语种为英语与汉语两种语言，开发集栏主要是指CWMT2022官方评测用的测试集中挑选出来汉英新闻语料数量作为初始语料，检测集栏中是指实验被测试的语句数量　　2.2试验结果与剖析　　为了对此文的依存树串实例机器英语翻译系统的有效果性进行测试，本试验的语料库作为根底，然后对本文系统进行比照分析，三个机器翻译系统译文结果，就是指属于等待评价译文与参考译文的n-单位片段实现的比拟分析该列表当中的数值，也叫BLEU值，倘假设计算结果匹配值越大，则等待评价的译文质量就越佳第三列表中数值，也叫NTST值该数值衡量译文质量的规范参考值，该列表数值越高，表明其等待评价译文的质量就越佳　　通过数据比拟能够知道，第二列与第三列表中此文依存树串实例机器英语翻译系统数值比其它两款机器翻译系统的数值均要高，这就体现依存树串实例机器英语翻译系统的性能更佳，是属于一种译文质量较好的翻译系统本试验是通过上文所论述的三种不一样的翻译系统将中文翻译成为英文结果，从中整理某一局部的译文进行分析所检验的中文语句是“信息产业展现快速开展的趋势〞，通过三种不同的译文系统进行翻译，而所得到译成英文的情况。

　　三种翻译系统的译文差别进行分析，发现主要在于对“快速开展〞这词，语义语言机器翻译系统的译文为“Keepingthemomengtumgoing〞,与开源统计机器翻译系统的译文“fastchange〞的原词具有很高差别，这与英语的语议与语法均不相符而依存树串实例机器英语翻译系统对此词的译文结果，尽管与相关参考译文相比拟，还存在一些缺乏，比方语序没有统一，但是能与语义要求相符，因此其准确性高[7]两种系统对实验语料库中的语句进行英文翻译成汉语与汉语翻译成英文的结果两个表中第一列是两种系统对每个句子平均翻译结果，语义语言机器翻译系系数大于此文依存树串实例机器英语翻译系统的平均数，这就体现了此文依存树串实例机器英语翻译系统的翻译的结果错误较少　　再对两表中的准确翻译召回率进行比拟，就能比拟分明地看出此依存树串实例机器英语翻译系统比语义语言机器翻译系统要高;对结果中首位准确翻译率与结果中前两位准确翻译率进行比拟，发现此文依存树串实例机器英语翻译系统较语义语言机器翻译系统均要高通过以上比拟分析可知，此文依存树串实例机器英语翻译系统能够使得翻译准确率得到提升，具有较强的英语语言文学翻译功能[8]。

　　3结论　　本文通过塑造依存树串实例机器英语翻译系统，并采取相关实验，通过从译文中各句的翻译结果(平均数)、译文结果中准确翻译的召回率、译文结果准确翻译率(第一位)、译文结果中准确翻译率(前两位)等方面进行比拟分析，最后实验结果说明，依存树串实例机器英语翻译系统较语义语言机器翻译系统翻译译文准确率更高，由此更加体现了该系统具有较强的英语语言文学翻译功能　　参考文献　　[1]汪昆,宗成庆,苏克毅.统计机器翻译与翻译记忆的动态融合办法三[J].中文信息学报,2022,29(02):87-89. 　　[2]季春元,熊泽金,侯艳芳,陈明.基于人机交互的网络化智能翻译系统设计[J].自动化与仪器仪表,2022,08(25):25-28. 　　[3]王丹丹.基于实例的汉英依存树到串机器翻译办法研究[D].北京：北京交通大学,2022. 。

下载提示

点击查看常见问题