java weka数据挖掘,基于 JAVA 的 WEKA 数据挖掘平台分析及二次开发

  • Post author:
  • Post category:java


内容简介:

毕业论文 基于 JAVA 的 WEKA 数据挖掘平台分析及二次开发

共60页

摘 要

数据挖掘是在“信息爆炸,知识缺乏”的背景下提出的新技术。所谓数据挖掘就是从大量的、不完整的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。该技术在银行业、市场业、零售业、保险业及电信业等诸多领域的数据分析中有着广阔的应用前景。

本文首先针对数据挖掘技术作了比较全面的综述,并深入分析聚类方法。其次,针对学术界典型的开放数据挖掘工具 WEKA,进行数据挖掘测试,主要包括预处理、分类、聚类、属性选择、关联规则及可视化等,并对挖掘结果进行统计分析,指出 WEKA 系统存在的缺陷及发展前景。为了弥补 WEKA 系统存在的一些缺陷,本文还在 WEKA 平台下进行二次开发,根据描述的 k-中心点轮换法的算法流程,利用 eclipse 在 WEKA 平台下嵌入该算法,并对其进行优化以提高其聚类效果。

虽然本文研究的 WEKA 数据挖掘工具目前还处于研究阶段,但它却汇集了多样化的机器学习算法,是数据挖掘研究的理想选择。同时,本文所研究的 k-中心点轮换算法改进了传统的 k-中心点算法,避免陷入局部最优,并进行了属性正常化、处理残缺值等优化,聚类效果明显提高了。

关键词:数据挖掘  WEKA 聚类分析 k-中心点轮换算法

目 录

1 前言 7

1.1 课题背景• 7

1.2 本文所做的主要工作• 7

1.3 本文结构 8

2 数据挖掘技术综述 9

2.1 数据挖掘的定义 9

2.2 数据挖掘的基本功能• 9

2.3 数据挖掘的流程 10

2.4 数据挖掘的常用方法和技术• 11

2.5 数据挖掘的应用领域• 12

2.6 国内外数据挖掘工具现状 13

2.7 聚类分析概述 14

2.7.1 聚类概念• 14

2.7.2 主要聚类方法的分类• 14

3 基于 WEKA 平台的数据挖掘测试 16

3.1 WEKA 系统简介 16

3.2 WEKA 系统的特点• 16

3.2.1 WEKA 系统的文件格式• 16

3.2.2 WEKA 系统的界面• 17

3.2.3 WEKA 实现的功能及算法• 19

3.2.4 WEKA 系统的包结构• 22

3.3 WEKA 系统的挖掘测试及结果分析• 24

3.3.1 WEKA 系统的数据挖掘过程 24

3.3.2 WEKA 系统的挖掘实验• 25

3.3.3 WEKA 系统中存在的问题• 34

3.4 WEKA 系统的发展前景 34

4 WEKA 平台下的二次开发 35

4.1 二次开发背景及一般过程 35

4.1.1 二次开发背景 35

4.1.2 二次开发一般过程• 35

4.1.3 系统的开发与运行环境• 35

4.2 K-中心点轮换算法 35

4.3 K-中心点轮换算法的实现 37

4.3.1 K-中心点轮换算法的类模块关系• 37

4.3.2 K-中心点轮换算法的流程图 • 38

4.3.3 K-中心点轮换算法的类说明 39

4.4 K-中心点轮换算法的测试 45

5 总结 49

致谢 50

参考文献 50

附录 51

相关说明:

1、下载本站部分资料,需要注册成为本站会员。如果你尚未注册或登录,请首先注册或登录。

2、48小时内下载同一文件,不重复扣金币。

3、下载后请用WinRAR或WinZIP解压缩后使用。

4、如采用迅雷等下载工具下载失败,请直接用浏览器下载。

5、如仍有其他下载问题,请看常见问题解答。

下载地址: