简介:主观评论句中的评价对象抽取是细粒度情感分析的任务之一,在公众舆情、用户产品评论、竞争情报分析等领域有着广泛的应用价值.针对中文话题型微博语言简洁、不规范、常常省略评价对象等特点,提出一种基于语言学特征和微博结构特征的话题型微博评价对象抽取方法.通过挖掘中文微博语料的结构与内容,将词、词性、情感词、通过句法分析获得的主谓关系、来自主题标签生成的主题词序列以及由语义角色标注所获得的施事与受事中的名词等多种特征相融合,同时将评价对象抽取看作序列标注问题,建立条件随机场模型进行学习并训练。实验结果表明,语言学特征和微博结构特征使准确率提高了约10%.
简介:介绍了一种多采样率CIC抽取滤波器。研究了滤波器的原理,重点分析了设计过程中滤波器的误差。在此基础上,用一个滤波器的设计实例验证了滤波器的误差理论,并验证了CIC抽取滤波器通过采样速率变换因子尺可降低滤波器的工作频率。结果表明,利用软件控制R可实现多采样率。
简介:摘要院本文主要讲述了对于信息抽取技术的研究从它的概念,和它具体应用的分析,到最后的如何运用做了简单的介绍以及在信息抽取的过程中所涉及到的自然语言处理技术和中文信息抽取具有怎样的目的,任务和技术。
简介:摘要目的研究肝细胞癌患者尿液代谢轮廓的变化,筛选具有临床诊断价值的特征代谢离子,建立疾病区分模型,从而帮助临床诊断。方法采用病例对照研究,通过超高效液相色谱与质谱联用(UPLC-MS)法分析肝细胞癌、肝硬化患者和健康人尿液标本,分别有32、28、28份。用MZmine2.0和SIMCA-P+12.0.1.0软件构建正交偏最小二乘判别分析(OPLS-DA)模型和主成成分分析(PCA)模型进行代谢物初筛,对最终检验所选择的代谢离子通过SPSS进行数据分析,用单因素方差分析对标志物进行分析筛选。最后通过计算受试者操作特征(ROC)曲线下面积对所筛选出的标志物进行敏感性和特异性分析。组间定量指标的比较采用单因素方差分析。结果OPLS-DA的模型参数R2X = 35.3%、R2Y = 86.9%、Q2 = 72.2%,具有较好的鉴别价值。检测共筛选出26个特征离子并鉴定了其中的17个。14,19-Dihydroaspidospermatine对健康人和肝细胞癌患者具有较高的鉴别价值,曲线下面积> 0.9,对肝细胞癌患者和肝硬化患者鉴别的ROC曲线下面积为0.88,高于甲胎蛋白的ROC曲线下面积(0.75)。结论基于UPLC-MS平台,成功构建PCA和OPLS-DA模型,提取并鉴定出肝细胞癌患者尿液的特征代谢离子,对辅助临床筛选出肝细胞癌患者具有一定价值。