简介:传统的生物医学命名实体识别方法需要大量的标注数据样本,但是在实际应用中标注样本代价高昂。为降低生物医学命名实体识别对标注样本的需求,本文提出通过使用PU学习中的两步法方法,将生物医学命名实体识别问题转化为PU场景下的命名实体识别问题。在第一步中分别使用1-DNF、Spy、NB和Rocchio算法在未标注数据中抽取强负例,然后在已有的正例数据和强负例数据的基础上构建隐马尔可夫模型,最后对待分类数据进行命名实体识别。在GENIA语料库上的实验结果显示,在标注数据较少的情况下,通过使用PU学习方法的两步法构建分类模型,其性能显著优于直接使用标注数据构建的分类模型,同时降低了人工标注数据的成本。
简介:尤其是能够以ROI压缩方式实现对图像中感兴趣区域的压缩,图6是ROI区域在原图像中的位置和大小,本文使用JPEG2000标准的Maxshift法对单幅数字医学图像的感兴趣区域做ROI压缩
简介:中国是农业大国,中国特有的历史文化使得中国拥有许多具有中国本土文化特色的农业词汇。经过长久的实践,中国特色农业词汇通常在其文化内涵的基础上带有明显的经济和政治意义。文章以ChinaDaily和XinhuaNet两家官媒(2001年1月——2016年12月)中涉及的中国特色农业词汇为研究对象,以归化与异化翻译理论为基础,归纳分析上述两大官方媒体为弥补中国特色农业词汇英译空缺现象所给出英译的翻译策略与方法,结合了特定的经济政治背景,以便在翻译的过程中有效地表达中国特色农业词汇,从而实现中西方农业文化的互通,同时为建立中国特色良好的国际形象创造条件。