简介:由于《中国图书馆分类法》的类目数目庞大和文献在各类目上分布的不均衡,导致基于机器统计学习的自动分类技术在此类多层分类上的力不从心。基于人工标引经验的自动分类试图通过情报检索语言兼容互换的原理解决这一问题,然而直接应用标引词串对分类进行匹配在实际应用中产生了一系列的问题。本文试图通过两种分类技术相结合的方法对信息资源进行分类,提出了用相关度度量来测定关键词和类目概念之间的关联,构建关键词、分类号、归属度三元组矩阵的方法进行分类匹配,并在小规模的测试集上得到了较好的效果。本文详细讨论此种分类器的构建原理、构建方法以及分类流程,并对该方法存在的不足进行了分析。
简介:1991年,我曾在《图书馆理论与实践》第4期上发表《阅读社会学初论》一文。此后近七年来,我一直未间断对阅读社会学这一课题的关注和思考,现把有关材料和思考所得作一小结,成"二论"篇,以就教于方家。1关于阅读社会学的研究内容和范围1995年,由国际阅读协会(IRA)出版的《读写词典》(《TheLiteracyDictionary:TheVocabularyofReadingandWriting》)对阅读社会学(Sociologyofrading)的解释是:1、研究各种社会力量,如社会经济形势和各种社会机构,如家庭等对阅读行为和阅读教育的影响。2、研究阅读对读者习惯和态度的影