简介:神经网络机器翻译技术模拟人脑神经系统,以深度学习技术为基础,将整个句子作为翻译的基本单元,使得机器翻译的准确率大大提升。谷歌、百度、腾讯三家公司推出的翻译软件都采用了神经网络翻译技术,通过比较可知三者的长句翻译能力突出,译文风格各具特色,但在语言方面都仍面临困境。首先,因语言差异导致的漏译误译;其次,因词义多义引起的选词障碍;第三,因语境因素带来的隐性含义的理解。本文认为只有不断完善深度学习的算法,建立纠错数据库,进行跨学科交流,才能进一步提升机器翻译质量。
简介:摘要:机器翻译,一般来讲是利用计算机将一种语言转变成另一种目标语言的过程,近年来取得了令人瞩目的进展。随着时代的进步发展,机器翻译下的俄汉互译又该何去何从?是一味的相信机器翻译,还是完全排斥,又或是机器翻译与人工翻译相结合?本文梳理了机器翻译的发展简史、机器翻译出现的问题、如何更好地运用机器进行俄汉互译、机器翻译的展望和前景。从而对机器翻译有一个更为清楚的认识。
简介:<正>一引言在科学技术迅猛发展,人类知识急剧增长的今天,我们比以往任何时候都更加迫切地需要借助机器进行语言翻译,因为即使许多人能够直接阅读外文资料,语言仍将是极其严重的障碍。人工翻译远远不能满足社会的需要,如果不克服这一语言障碍,将会有许多科技人员作重复劳动,人类知识就不会得到很好的整体地开发。机器翻译(以下称MT)的研究就是要克服人类的语言障碍,尽早推出实用的MT系统。然而,经过近四十年的研究,机器翻译的译文质量仍不理想。机器翻译如此困难的原因何在?这主要在于人理解语言的复杂性和语言本身的开放性。人能够理解语言,不仅由于他具有词汇和句法等语言的知识,而且
简介:摘要:基于深度学习的机器翻译技术应用,不仅对于当代人工智能和大数据技术的发展提供重要的物质支撑和精神支持,更为新时代我国语言咨询服务行业经济的高质量发展夯实坚实的基础,真正促进产业结构的优化升级。但是,现如今基于深度学习的机器翻译技术应用存在一系列问题,包括机器翻译质量有待提升、个性化定制用户需要增加、MTPE模式应用占比较小。而在路径创新层面,包括加强机器翻译技术应用的普及力度、深化机器翻译技术应用的科技研发、提高机器翻译业务操作人员的水平。因此,本文旨在结合机器翻译技术应用的发展特征和现状,探究未来基于深度学习的机器翻译技术应用的发展前景和上升维度。
简介:摘要目的分析自动机器学习(autoML)模型预测孕早期子痫前期风险的效果。方法选取2017年1月—2020年10月2 180例在济南市第二妇幼保健院建档并于孕12周进行孕检的单胎孕妇,根据整个孕期是否发生子痫前期分为子痫前期组(103例)和对照组(2 077例),比较两组孕妇临床资料和血液学指标差异,分析各指标与子痫前期发生风险的相关性。将纳入研究的孕妇按7∶3的比例随机分为训练集和测试集,应用autogluon autoML算法构建多种机器学习模型,并在训练集中进行训练和交叉验证,比较不同模型的训练和验证准确率。分析各指标在autoML模型中的重要性,以autoML模型和logistic回归模型分别对测试集孕妇孕早期子痫前期的发生风险进行预测,应用受试者工作特征(ROC)曲线对autoML模型和logistic回归模型的预测效能进行评价。结果子痫前期组年龄、孕前体质指数、孕12周体质指数、孕12周腰围、饮酒史比例、超敏C-反应蛋白(hs-CRP)、三酰甘油、低密度脂蛋白胆固醇(LDL-C)、天冬氨酸氨基转移酶(AST)、血小板分布宽度(PDW)、平均血小板体积、促甲状腺激素(TSH)、β-人绒毛膜促性腺激素水平均显著高于对照组(均P<0.05),游离三碘甲状腺原氨酸(游离T3)、游离甲状腺素(游离T4)、胎盘生长因子(PIGF)、可溶性fms样酪氨酸激酶-1(sFlt-1)、妊娠相关血浆蛋白-A(PAPP-A)均显著低于对照组(均P<0.05)。相关性分析显示,孕前体质指数、孕12周体质指数、孕12周腰围、hs-CRP、三酰甘油、AST、TSH、游离T3、游离T4、β-HCG、PIGF、sFlt-1和PAPP-A等与孕早期子痫前期风险的相关性较高;但各指标间的相关性均较低。通过autoML模型算法共构建8类18个模型,基于FastAI的神经网络_L2在训练集(0.963)和验证集(0.971)中的准确率最高;TSH、LDL-C、PDW、孕12周腰围、sFlt-1、AST等指标重要性较高,游离T4、总胆固醇、孕次、饮酒史、产次和高血压家族史重要性较低。孕早期autoML模型预测子痫前期发生风险的ROC曲线下面积显著高于logistic回归模型(0.984比0.765,P=0.002);两种预测模型在训练集的预测准确率差异无统计学意义(P>0.05);autoML模型在测试集的预测准确率和灵敏度均显著高于logistic回归模型(99.54%比98.32%,93.75%比75.00%,均P<0.05)。结论孕早期TSH、LDL-C、PDW、孕12周腰围、sFlt-1、AST等因素与子痫前期发生风险具有一定相关性,基于孕早期指标的autoML模型对子痫前期发生风险具有较高的预测价值。
简介:摘要现阶段,我国国际上所开展的研究工作会关注于维汉机器翻译内容,这种机器翻译的方式带有一定的通用性,其在研究维汉机器翻译内容时,可以以主流机器翻译方式为基准。维吾尔语的语言较为复杂,其所形态变化比较丰富,很多词根都可以进一步的演变成为多种新形式。相比之下,我国汉语的形态变化就比较微弱,所以,目前,国际上所使用的机器翻译主要针对的对象就是英语等形态变化较为简单的语言,不需要对词形的变化进行分析。可以将各个不同词形的词语当做独立性的词语分析。本文主要就维汉机器翻译的维语命名实体的识别与翻译进行探究,找出现阶段我国维汉机器翻译现状以及存在的问题,科学合理的设计相应的系统。
简介:摘要:机器翻译软件不断被开发利用,质量不断提高。在功能对等翻译理论视角下,对比机器翻译和人工翻译的质量,仍然存在着许多问题。本文结合实例,分析其优势、劣势,并从中提炼出给翻译学习者的经验建议。