学科分类
/ 1
5 个结果
  • 简介:本文详细介绍了中文文本自动校对的研究现状,包括文本中错误的分类,中文自动校对中常用的语言模型,以及一些有代表性的工作.作为参考,本文还介绍了英文拼写检查的方法,比较了中英文自动校对的异同并重点介绍了其中对中文自动校对有参考价值的几种基于特征的方法.

  • 标签: 中文文本自动校对 拼写检查 自然语言处理
  • 简介:汉语自动分词中的歧义问题侯敏,孙建军引言随着中文信息处理研究的不断深入,出现了多种多样的自动分词方法。评定一种切分方法或一个分词系统的标准不外两条:一是速度,二是精度,而第二条尤为重要。要想提高切分精度,除了要建立一部(或几部)较完备的词典外,最重要...

  • 标签: 汉语自动分词 歧义字段 确定法 歧义切分 歧义现象 句子歧义
  • 简介:中文姓名的辨识是自动分词、自动文摘的基础.独立于自动分词,我们运用姓名用字概率和规则,设计并实现了一个中文姓名辨识系统.对207757字语料进行了测试,召回率达到92.57%,精确率达到80.35%,且速度较快.

  • 标签: 概率分布 规则筛选 兼类姓 专有人名 特殊候选姓名对
  • 简介:本文结合藏文各类形态特征,首次提出了一种基于格助词和接续特征(BCCF,BasedonCase-auxiliarywordandContinuousFeature)的书面藏文自动分词方案.其总体技术特点是:在格助词、接续特征、字性知识库以及词典支持下,进行逐级定位的确定性分词.初步测试表明:这一方案在发现和消除切分歧义、解决未登录词问题,进而在提高藏文分词精度方面具有很高的实用价值.

  • 标签: 格助词 接续特征 藏文分词
  • 简介:并列组联的周知条件存在不足:它只涉及联项条件,未涉及联项以外的其他条件;另外,即使满足了这些条件,也未必能产出自然合法的并列短语.本文利用排除法、推导法和系统动态的方法分析认为,语言系统从原始雏形状态的意合方式出发,在语音、句法、语用、语义等领域不断寻找控制因素,借助松联、有标、外设这三种方式和联项组织的超常意义手段,从致联或竞争这两种不同句法水平上发力,引发了词际并列的可联范围发生四度扩张.为维持并列可联性,扩大可联范围,各种内外条件按有效机制互相作用和牵制,结果不但满足了言语自由创新的需要,而且导致结构多样化和系统复杂化,完善了语言结构系统,提高了语言系统的品质和效能.

  • 标签: 并列 组联 扩张 控制