数据挖掘模拟试题(二) 联系客服

发布时间 : 星期三 文章数据挖掘模拟试题(二)更新完毕开始阅读93e129da6f1aff00bed51ef1

绘制系统聚类图。

24个菌株气相色谱法测得的12种脂肪酸的百分含量

编号

1 0.12 25.42 0.00 7.72 0.00 0.00 0.00 29.06 25.92 0.00 11.76 0.00 2 0.09 7.30 0.00 5.04 0.00 0.00 0.00 24.65 22.54 0.00 39.58 0.00 3 0.02 4.94 0.00 4.02 0.00 0.00 0.00 27.12 23.38 1.82 38.52 0.00 4 0.02 7.52 0.03 3.76 0.00 0.03 0.00 15.02 19.20 2.54 51.97 0.00 5 0.03 29.13 0.00 9.06 0.00 0.00 0.00 14.31 10.99 3.19 34.02 0.00 6 1.19 23.79 0.00 8.16 0.00 0.00 0.00 21.03 37.64 0.00 8.26 0.00 7 0.03 12.39 1.66 4.17 0.00 0.02 0.00 20.70 19.11 1.34 41.05 0.00 8 0.21 12.58 0.02 5.37 0.00 0.00 0.00 20.34 30.11 3.00 28.29 0.00 9 0.14 5.59 0.12 3.17 0.00 0.06 0.00 20.05 42.30 5.43 22.97 0.00 10 0.00 4.15 0.00 36.32 21.15 0.00 0.00 0.00 36.06 0.00 0.00 0.00 11 0.00 5.33 0.00 37.84 8.59 0.00 0.00 0.00 48.25 0.00 0.00 0.00 12 0.00 9.96 0.00 37.96 20.18 0.00 0.00 0.00 25.30 3.35 0.00 0.00 13 0.00 10.45 0.00 45.65 6.21 0.00 0.00 0.00 22.02 0.00 15.67 0.00 14 0.00 1.62 0.00 41.36 16.27 0.00 0.00 0.00 30.65 4.65 15.45 0.00 15 0.00 5.76 0.75 34.52 7.14 0.00 0.00 0.00 31.75 0.00 19.93 0.00 16 0.00 12.93 0.00 46.53 5.41 0.00 0.00 0.00 20.39 0.00 14.72 0.00 17 0.00 15.68 0.00 34.77 19.85 0.00 0.00 0.00 17.52 0.00 7.72 0.00 18 0.00 7.60 0.00 35.88 21.46 0.00 0.00 0.00 29.70 5.34 0.00 0.00 19 0.00 7.23 0.00 41.78 5.51 0.00 0.00 0.00 27.83 0.00 17.67 0.00 20 0.00 1.87 0.00 35.13 1.91 0.00 0.00 0.00 51.89 0.00 9.30 0.00 21 0.41 3.34 0.21 33.59 11.45 0.00 14.79 0.23 26.31 0.00 9.35 0.30 22 2.26 2.23 1.66 27.81 15.64 0.00 11.71 1.77 17.69 0.00 17.92 1.31 23 4.49 4.50 0.20 31.62 15.44 0.00 12.44 5.89 17.96 0.00 6.64 0.83 24 3.85 6.76 0.19 38.95 10.10 0.00 12.24 2.47 18.95 0.00 6.40 0.10

7.下表是某医院1999年~2007年门诊的就诊人次变化情况,试用指数曲线拟合门诊量的变化趋势,并对2008年~2010年的门诊量进行预测。

X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12

某医院1999年~2007年门诊量(千人次)

年 份 1999 2000 2001 2002 2003 2004 2005 2006 2007 门诊量

192

211

230

234

276

351

428

540

657

8.某神经网络采用双极性sigmoid函数,学习率η=0.25,初始权向量W(0)=(1,0,1)T,两对输入样本为X1=(2,0,-1)T,d1=-1;X2=(1,-2,-1)T, d2=1。试用delta学习规则进行训练,并写出(提示:双极性sigmoid函数的导数为f(net)=1/2(1-o2)。)

9. 调查某市412名艾滋病高危人群的CCR2-64I基因和SDF1-3′A基因的基因型分布情况如下表,问两个基因型之间是否有关联?

某市412名艾滋病高危人群CCR2-64I基因和SDF1-3′A基因的基因型分布 SDF1-3′A基因型

Wt/wt

Wt/wt Wt/mt Mt/mt 合 计

10.下表是对加何种油的调查表,请根据ID3算法画出决策树。 计数 年龄 收入 低 高 中 低 高 中 高 高 中 种族 亚裔 白人 西班牙 非洲 白人 亚裔 亚裔 非洲 西班牙 信誉 良 良 良 优 优 优 良 优 良 良 加何种油 Supreme Regular Plus Supreme Regular Plus Regular Regular Plus Regular 购物清单 啤酒,尿布,婴儿爽身粉,面包,雨伞 尿布,婴儿爽身粉 啤酒,尿布,牛奶 尿布,啤酒,洗衣粉 啤酒,牛奶,可乐(coke) 2000 老 1500 老 3900 中 3200 中 5200 青 1800 青 2400 青 2200 青 1600 老 121 36 8 165

CCR2-64I基因型

Wt/mt 52 72 51 175

Mt/mt 11 54 7 72

184 162 66 412 合计

2000 青 高 西班牙 11. 求出下表的强关联规则 记录号 1 2 3 4 5