简介:摘要院数据挖掘中的聚类技术是一种非监督分类技术。概述了聚类分析算法中的数据结构和数据类型,分析了聚类分析的意义及研究现状,比较了几种聚类算法的优点及问题,并结合通信领域的应用指出了K-Means聚类技术的绝对优势。
简介:摘要本文阐述了基于数据挖掘的数字档案信息管理,信息化建设更是被列为社会发展的首要内容,尤其是学校档案馆更侧重教学与科研,网页档案化管理是必然的趋势。
简介:目的:运用数据挖掘方法对近30年来以通下法治疗中风病的文献资料进行质量分析并总结中风病发病、证候及方药应用规律。方法收集1979-2013年在CNKI上公开发表的应用通下法治疗中风病的文献,录入设计数据库中,对符合文献纳入标准的文献通过改良Jadad量表进行质量评价。同时对于文献中病例基本资料、辨证分型和方药的使用进行分析,利用MicrosoftExcel工具对病例特征进行描述性分析。运用频数分析对病例症状、舌脉、证型、常用方剂和药物规律进行数据挖掘。结果中风病的症状除了中风病本身五大主症外,大便不通、腹胀、喉中痰鸣出现频率高,头痛、烦躁、头晕、发热、呕吐呃逆、面赤、喘息气粗等症状相对出现较多。舌质以红、暗红、绛红和紫瘀为主,脉象多表现为弦脉、滑脉和数脉,脉象并见以弦滑脉最多,其次为弦数脉和滑数脉。主要病理因素中痰证出现频率最高,其次为热证、风证、瘀证、虚证和火证。处方用药除了大量运用泻下剂,也兼顾祛风、清热、祛痰、理血、表里双解和治疡。药物使用频次以大黄、芒硝、胆南星、瓜蒌、枳实、厚朴和菖蒲应用最多。除了使用汤剂、丸剂外,还有胶囊及颗粒剂。方药服用方式包括口服、鼻饲、灌肠、静脉滴注以及浴脐。方剂大多数为4~12味药,总量50~150g之间居多。结论中风病痰热及腑实证集中出现,且在治疗中以应用泻下药及化痰止咳平喘药物为主,临床辨证时应重视痰热腑实病机对中风病各阶段的影响,灵活应用通下法。
简介:要了解web数据挖掘技术,首先就必须了解数据挖掘技术。数据挖掘是指从大量不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的有用的信息和知识的过程,它的表现形式为概念(Concepts)、规则(Rules)、模式(Patterns)等形式。数据挖掘技术是人们长期对数据库技术进行研究和开发的结果。起初各种商业数据是存储在计算机的数据库中的,然后发展到可对数据库进行查询和访问,进而发展到对数据库的即时遍历。Web数据挖掘是一种综合的技术,它主要是使用数据挖掘技术在互联网挖掘各种有用的、有趣的、隐藏起来的信息或者是有用的模式。与传统的数据挖掘相比,web数据挖掘所挖掘的信息更加的海量,这些信息具有异构和分布广的特点。Web数据挖掘根据所处理的对象可以分为三类web文档的内容挖掘、web文档的结构挖掘、web使用的挖掘。Web文档的内容挖掘指的是从web文档及对其描述内容中获取到有用的信息,即是对web上大量的各种文档集合的内容进行处理,例如摘要、分类、聚类、关联分析等。同时内容挖掘还可以对各种多媒体信息进行挖掘。Web上的内容摘要是用简洁的语言和方式对文档的内容进行描述和解释,让用户在不用浏览全文的情况下就可以对全文的内容和文章写作的目的有一个总体的了解。
简介:在云计算环境下,对高级持续威胁数据的准确挖掘可以提高云计算网络的安全防御能力.高级持续威胁数据具有极值扰动非线性特征,传统的线性处理方法难以实现对这类数据的准确挖掘.提出一种基于极值扰动非线性特征提取的云计算环境下的高级持续威胁数据挖掘仿真模型,对系统载荷运行情况进行评估,得到云计算下的动态任务调配,分析高级持续威胁数据的极值扰动非线性特性,计算高级持续威胁数据的稳态概率,得到极值扰动非线性特征,对非线性特征进行脉冲响应不变周期标记.实现了高级持续威胁数据极值扰动非线性特征的挖掘,构建数据挖掘模型.仿真实验表明,算法对持续威胁数据的正确检测概率在95%以上,数据挖掘性能优越,在云计算环境下的高级持续威胁数据的检测挖掘等领域应用价值较高,为网络安全系统构建等奠定基础。
简介:摘要院数据挖掘方法的应用可以使管理者获得隐藏于学生数据库的知识,发现这些数据中有价值的关系和规则,通过对现有数据的分析和处理进一步预测未来的发展趋势和可能性,对学校的教学和管理提供有效的决策依据,从而提高学校的整体实力。
简介:摘要院本文在传统网络教学和资源共享课程系统平台的基础上,运用数据挖掘技术对资源共享课程数据挖掘技术进行智能化的优化。在资源共享课程建设数据库中建立基于数据分析的数据仓库,采用关联计算,聚类分析,TF-IDF等方法,找到系统中资源之间的内在联系,使系统资源智能地跟踪用户操作,为资源共享课程的网络平台教学活动提供更人性化的服务。