Web日志挖掘研究

在线阅读 下载PDF 导出详情
摘要 通过对Web服务器日志文件进行分析,可以发现相似客户群体、相关Web页面和频繁访问路径.在本文算法中,首先以Web站点的URL为行、以UserID为列建立URL-UserID关联矩阵,其元素值为用户的访问次数.然后,采用模糊聚类算法和K-平均算法两种方法分别对列向量进行分析得到相似客户群体,对行向量进行分析可获得相关页面,对后者再进一步处理还可以发现频繁访问路径.实验结果表明了算法的有效性.
机构地区 不详
出处 《宁波工程学院学报》 2005年2期
出版日期 2005年02月12日(中国期刊网平台首次上网日期,不代表论文的发表时间)
  • 相关文献