发布时间 : 星期五 文章数据仓库与数据挖掘实验指导书王浩畅资料更新完毕开始阅读0d819aca32687e21af45b307e87101f69f31fb0d
数据仓库与数据挖掘
实 验 指 导 书
东北石油大学计算机与信息技术系
王浩畅
实验一 Weka实验环境初探
一、实验名称: Weka实验环境初探 二、实验目的:
通过一个已有的数据集,在weka环境下,测试常用数据挖掘算法,熟悉Weka环境。
三、实验要求
1. 熟悉weka的应用环境。 2. 了解数据挖掘常用算法。
3. 在weka环境下,测试常用数据挖掘算法。 四、实验平台
新西兰怀卡托大学研制的Weka系统 五、实验数据
Weka安装目录下data文件夹中的数据集weather.nominal.arff,weather.arff 六、实验方法和步骤
1、首先,选择数据集weather.nominal.arff,操作步骤为点击Explorer,进入主界面,点击左上角的“Open file...”按钮,选择数据集weather.nominal.arff文件,该文件中存储着表格中的数据,点击区域2中的“Edit”可以看到相应的数据:
选择上端的Associate选项页,即数据挖掘中的关联规则挖掘选项,此处要做的是从上述数据集中寻找关联规则。点击后进入如下界面:
2、现在打开weather.arff,数据集中的类别换成数字。
选择上端的Associate选项页,但是在Associate选项卡中Start按钮为灰色的,也就是说这个时候无法使用Apriori算法进行规则的挖掘,原因在于Apriori算法不能应用于连续型的数值类型。所以现在需要对数值进行离散化,就是类似于将20-30℃划分为“热”,0-10℃定义为“冷”,这样经过对数值型属性的离散化,就可以应用Apriori算法了。Weka提供了良好的数据预处理方法。第一步:选择要预处理的属性temperrature