学科分类
/ 11
209 个结果
  • 简介:用户访问数据中往往存在大量无用或与当前信息挖掘无关的数据,我们通过数据清洗从挖掘对象中去除不相关的数据,并实现了用户识别、会话识别、格式化等步骤,对WEB信息进行预处理,为进一步的操作提供了较好的数据格式,提高了挖掘效率。同时,因特网上的信息往往具有非结构化或半结构化特性,难以得到传统数据挖掘技术的支持,我们通过事务识别技术解决了这一问题,将访问序列组织成逻辑单元以表示事务或用户会话,将所有事务组成一个事务数据库,识别出事务后就可以利用对传统数据挖掘的方法对WEB数据进行挖掘:事务识别技术有多种实现形式,不同形式有不同的应用场合,本文根据特定挖掘任务,实现了以时间维来分割事务的算法,并给出了一些实验数据

  • 标签: 数据库 数据处理 数据库管理系统 WEB 数据挖掘 数据格式
  • 简介:分析传统关联关系挖掘的主要缺陷,提出关联模型的概念以及关联模式挖掘算法,指出通过多种模式的挖掘,找到课程之间隐含的关联关系,并通过真实的教学数据验证该算法,通过分析实验结果,得出该算法能够有效准确地挖掘出两门课程之间关联关系的结论。

  • 标签: 教学数据 数据挖掘 关联模式
  • 简介:本文介绍了Web数据挖掘的定义、分类以及特点,阐述了Web数据挖掘在结构化数据方面所具有的速度快、准确性高等特点,并从HTTP交互模块与HTML解析模块分析了Web数据挖掘的原理与流程,并重点介绍了基于Python计算机程序语言的Web数据挖掘设计。

  • 标签: PYTHON 大数据 数据挖掘 数据处理
  • 简介:随着中国加入WTO和国内电信业的改革,各电信运营商在企业大用户、长途电话、IP业务等各方面展开了激烈的竞争。可以看到电信市场上,运营商们正层出不穷地推出新的增值业务和服务,并不断重申深度挖掘基础业务提供ARPU值的重要性,应该说电信营销已经从混沌状态走到了一种理智清晰的状态。在这种状况下,找到ARPU贡献率高的用户、提供有竞争力的业务、提高用户满意度以及用户忠诚度,无疑需要建立一种理性的决策方式。而理性决策的获得总是脱离不

  • 标签: 企业 中国 电信营销 ARPU值 电信业 用户忠诚度
  • 简介:随着计算机网络技术的快速发展及大数据时代的到来,大数据技术在旅游行业中也得到了有效应用,智慧旅游成为旅游行业发展的一个主流趋势。大数据挖掘在智慧旅游建设推进中有着重要的作用,基于此,本文对大数据挖掘在智慧旅游中的应用进行了探讨,旨在提高大数据挖掘技术在旅游发展中的应用,促进智慧旅游的实现。

  • 标签: 大数据 挖掘 智慧旅游
  • 简介:数据时代下,政府网络信息监管、企业运营决策等都需要对大量数据完成数据分析,从中抽取有用的知识和规则,但原始数据中又包含许多敏感性的信息,因此在数据挖掘的过程中要兼顾保护好用户的隐私信息。对隐私保护关键技术进行总结,对隐私保护算法进行研究和改进,为基于隐私保护的大数据挖掘开辟有效手段。

  • 标签: 隐私保护 大数据挖掘 算法
  • 简介:诸如医学、个人档案管理等领域中的数据挖掘截然不同于其它领域的数据挖掘,它的一个最大的特征就是涉及到人这个主体及其隐私问题,因此有着广泛的社会影响。通过从伦理、法律和社会的限制,主体记录的处理及相关算法、数据挖掘者的责任等方面的研究,提出私有数据挖掘中的个人隐私和社会影响问题及其解决办法。

  • 标签: 数据挖掘 数据算法 隐私
  • 简介:由于现在科学技术的迅猛发展以及人民生活水平的不断提升,互联网行业在悄无声息的进入大众的生活中,计算机也被应用在各行各业中。从社会网络到蛋白质交互网络等不同的领域产生了大量的数据,而图作为统计这些巨大数据的一个载体不仅能精确的描述出数据的属性,还能说明数据结构的特征,这些优势让以不确定图模型的数据挖掘算法在社会中得到广泛的应用。

  • 标签: 数据 挖掘算法 不确定图
  • 简介:随着大数据时代的来临,在研究生中实行全英文教学既是国际化发展的要求,也是由数据挖掘课程本身所具有的学科性质决定的。文章从全英文教学存在的问题和数据挖掘课程自身的特点出发,就该课程全英文教学模式、师资力量、学生外语水平、教材精选、教学管理等方面对该课程实施全英文教学的途径作详细阐述。

  • 标签: 数据挖掘 全英文教学 教学模式
  • 简介:数据集中挖掘频繁模式是数据挖掘研究的关键环节之一。在过去,很多的努力都集中在独立数据挖掘上。然而,现实世界中许多实体之间总会保持着千丝万缕的关系。如何获得这些关系的频繁模式,已逐渐成为近年来研究的一个目标,我们将它称之为频繁结构的挖掘。在数据挖掘中,一个重要的方法是关联规则挖掘。它被用来发现频繁出现在数据库事务中的项集;另一个重要的方法是序列挖掘,它的任务是去寻找一个项集的序列。这些挖掘任务都被称为频繁模式的挖掘

  • 标签: 频繁模式 项集 挖掘算法 数据挖掘 关联规则挖掘 事务
  • 简介:IBM近日宣称,在推动网格计算技术进入天花治疗药物开发方面已取得成效。目前还没有治疗天花的方法,唯一的预防手段是接受疫苗接种。据悉,此项技术已获得美国国防部的资金援助。

  • 标签: 网格计算 信息基础设施 网格服务 网络经济 技术标准
  • 简介:我们身处一个变化的时代。变化产生机会,也带来风险与压力。在速度变快、扑朔迷离的今天,无论是组织,或是我们自己都比以往更需要领导。领导究竟是什么?领导力究竟存在于哪里?怎样才能提升你的领导力,进而卓越你的领导力?哪些因素制约着您的领导力的发展。时代在变,领导学在发展,领导的素质也在不断提高,进而对领导力的要求也在与时俱进,

  • 标签: 平凡领导力 挖掘平凡
  • 简介:随着互联网的高速发展,Web挖掘由于其独特的优点,在电子商务的应用中扮演了越来越重要的角色。文章主要介绍了web挖掘的概念和分类,论述了电子商务中Web挖掘的过程和方法,最后阐述了Web挖掘在电子商务中的具体应用。

  • 标签: WEB挖掘 电子商务 数据挖掘
  • 简介:本文首先介绍了Web挖掘和电子学习(e—learning)&其在商业和教育中的应用,然后在WebCT学习环境中对学生成绩做了一个模式分类的预测实验,证明了Web挖掘可以成为构建e—learning知识的一种方法,具有改善学生学习模式的潜在作用。

  • 标签: E—learning(电子学习) WEB挖掘 课程管理系统(CMS) 数据挖掘 WEBCT
  • 简介:客户分类是银行必须面对的问题。对已有客户进行分类,有助于银行采取一些有针对性的提高客户价值的措施。该文在数据挖掘过程中,使用跨行业数据挖掘过程标准CRISP-DM。构建基于银行客户价值的分类挖掘模型。并在实例中说明其使用效果。

  • 标签: 银行客户价值 数据挖掘 模型构建
  • 简介:数据的采集、提取和理解是人类感知和认识世界的基本途径之一,数据可视化为人类洞察数据的内涵、理解数据蕴藏的规律提供了重要的手段。随着数据时代的来临,大数据的分析、挖掘与可视化已经成为信息技术发展的迫切需求。面对当前科学可视化、信息可视化、可视分析研究和应用的新形势,

  • 标签: 数据可视化 丛书 科学可视化 信息可视化 信息技术 可视分析
  • 简介:数据是毋庸置疑的技术趋势和话题焦点,但是多数情况下,可能人们都太纠结大数据“是什么?不是什么?”,这让话题看起来永远都不会有结论。而本书作者另辟蹊径,在另外的角度上对这一趋势进行解读,即什么才是大数据的正确之路。现在我们就好像身处大数据技术演进的寒武纪时代,在这个技术变革时期,各种技术粉墨登场,快速演化。而这恰恰是人们对现有大数据技术一切疑惑和模棱两可观点的源头,也正是作者在开篇第1章和结尾表述的观点。因为我们身处变革当中,所以很好理解为什么作者并不急于回答“大数据是什么“。只要翻翻这本书,你一定会发现它和市面上其它大数据书籍的不同。

  • 标签: 大规模分析 海量数据 寻路 技术演进 技术变革 数据技术