通用数据挖掘系统
V3.0
使用说明
(1)
目录清单:
src
下是源代码。其中,
hjk
是作者开发的工具类包,本程序有多项依赖于它。
Dms30
是本程序主代码包,
DmsClient.java
是客户端主程序,
DmsServer.java
是服务器端主程序,
DmsProcessor.java
是多线程数据处理核心。
wtmpx.zip
是
unix
原始记录样本文件,解压后可以作为测试样例。
DMS_Client.jar
是可执行的客户端
java
程序。
DMS_Server.jar
是可执行的服务器端
java
程序。
DMS_lib
下是
dom4j
等相关
jar
包。
(2)
操作说明
本系统的工作模式是数据采集分散在各应用端,即
unix
实验室主机上,由客户端程序实时采集、匹配用户登录数据后,统一发送到中心服务器进行集中处理并存储到数据库,并定期产生报告数据到数据库
以备前台计费查询和运算。
1.
部署服务器端程序到中心服务器,测试数据库连接,如图所示:
程序会自动打开一个记事本,请参照样本编辑数据库连接参数。如果数据连接测试不成功,则你只能测试分类存储到文件功能。
2.
程序默认已经启动实时分类和存储服务,如需测试分类和存储为文件服务,请显示启动它:
3.
部署和启动客户端程序,程序启动时会让你选择
unix
原始记录文件所在位置,以及数据备份目录:
4.
配置中心服务器地址,这之前可能你需在服务端程序中查看服务主机的
IP,
如图所示:
输入正确的服务端地址:
5.
测试、初始化和启动服务:
(
3
)
功能说明
用户在线时间记录数据默认每30分钟采集、传输到中心服务器,实时存储至数据库表中;默认每天凌晨
3
时汇总上一天用户在线时间形成日报表;默认每月的
5
号汇总上一月用户在线时间形成月报表;默认每年第一月的
5
号汇总上一年用户在线时间形成年报表。