知网查重论文样例–数据挖掘的方法

知网查重论文样例--数据挖掘的方法

数据挖掘中用到的方法主要有:

1)关联规则

关联规则顾名思义就是数据对象之间互相的依赖关系,要找出关联规则的任务就是要从数据集中发现那些支持度、置信度都大于某一给定值的强关联规则。当今,关联规则从单一概念层次已经发展到多概念层次,在概念层次上的不断深入发展,关联规则所提供的信息也就越来越实际和具体。

数据挖掘中常用到的关联规则算法有:Apriori、FP-tree算法。

2)分类分析

分类是数据挖掘的最基本的一种形式,它的任务是对数据集中的每一类数据进行学习,并建立起一个具有预测功能的分类模型,用来预测未知数据的类别。

数据挖掘中常用到的分类方法有:决策树分类方法、贝叶斯分类方法、k-最近邻分类方法、神经网络分类方法以及支持向量机分类方法,其中决策树方法中有ID3[18]、CART、SLIQ、C4.5等。

3)聚类分析

在机器学习中,相对于称为监督学习的分类,聚类被认为是非监督学习,它们所采用的方法差距较大。聚类是数据挖掘和统计分析中的一个重要研究领域,聚类就是将数据聚集成若干个类,类中数据之间的相似性较大,但类间具有较大的差异性[19]。与分类不同的是聚类是基于当前的要处理的数据,事先并不知道每个数据对象要归于那个类。

数据挖掘中常用到聚类算法有:基于划分的K-means 算法、基于密度的DBSCAN算法和基于分层的CURE算法。

4)统计分析

利用统计分析来对数据集挖掘的主要思想是:利用统计的方法对特定的数据集来假设一个分布模型或概率模型(例如一个正态分布),然后再根据模型采用适当的方法来进行数据挖掘。

5)可视化分析

数据挖掘的过程和结果都可以利用可视化的方法进行表示,可视化技术能够从数据集中发现新的趋势与模式,并可采用直观的图形将这些模式和趋势表现出来,易于用户理解和使用。

  • 知网查重论文样例–数据挖掘的方法已关闭评论
  • 2,440 views
    A+
发布日期:2018年01月16日  所属分类:论文检测样例
标签: