简介:楚辞很早就传播到了日本。日本学者研究楚辞认真而努力,他们不仅研究楚辞的文本,也研究楚辞的作者如屈原和宋玉等人。日本学者不仅研究楚辞的汉文本,还将楚辞注解为一般日本人能够读懂的通用的版本,也作有楚辞的日文译本。虽然日本研究楚辞起步很早,但是日本的楚辞研究,其主要的成就还是出现于现代阶段。日本现代楚辞研究的特色主要有五点,其中最为突出的是将楚辞与日本民族和国家的起源联系起来这一点。使用楚辞为材料以证明日本为神国,这是日本楚辞研究的内驱力。以楚辞证明日本为神国,此内驱力一直存在,而且在现代益发突出,只不过随着时代的进步,日本学术界的楚辞研究采取了更加学术化的表现形态。
简介:不确定性是数据的固有属性,在实验过程中由于仪器的限制或者收集过程中的误差都会造成数据的不确定性。数据挖掘算法在处理不确定数据的相关研究尚处于初级阶段,不确定数据聚类是不确定数据研究中的典型问题,已有一些聚类算法被应用到处理不确定数据,如UK-means等。无论是UK-means还是FDBSCAN都仅仅考虑了不确定数据之间的几何距离,而没有考虑到不确定数据之间的概率分布差异。然而,概率分布特征是不确定数据的本质特征,考虑不确定数据的概率分布能够更准确度量不确定数据间的距离,从而提高聚类算法的性能,本文使用核函数度量不确定数据与类中心的距离,然后使用UK-means算法聚类不确定数据,通过大量实验验证了本文提出的距离函数优于使用欧式距离期望的UK-means方法。
简介:k均值算法是一个常用的局部搜索算法,它的主要缺陷是容易陷入局部极小,并且该局部极小解与全局最优解往往有很大的偏差.本文提出一个基于K-均值的迭代局部搜索文档聚类算法.该算法以k均值算法所得到的解作为初始解,从该初始解开始作局部搜索,在搜索过程中接受部分劣解.当解无法改进时,算法对所得到的局部极小解做适当强度的扰动后进行下一次的迭代,以跳出局部极小,从而拓展了搜索的范围.实验结果表明该算法对文档数据集聚类的正确性达99%以上.