模式识别实验指导书071005 联系客服

发布时间 : 星期六 文章模式识别实验指导书071005更新完毕开始阅读8b2e2035a32d7375a4178016

6w1w2420-2-4-6-6-4-20246

3.6 实验任务:

1、 用matlab完成感知准则函数确定程序的设计。

2、 请确定sample=[(0,-3),(1,3),(-1,5),(-1,1),(0.5,6),(-3,-1),(2,-1),(0,1), (1,1),(-0.5,-0.5),( 0.5,-0.5)];属于哪个样本空间,根据数据画出分类的结果。 3、 请分析一下?k和a(1)对于感知函数准则确定的影响,并确定当?k=1/2/3时,相应的

k的值,以及a(1)不同时,k值得变化情况。

4、 根据实验结果请说明感知准则函数是否是唯一的,为什么?

11

实验四、近邻法分类器设计

4.1 实验类型:

设计型:近邻法分类器设计

4.2 实验目的:

本实验旨在让同学理解近邻法的原理,通过软件编程分段线性分类器的极端情况,理解k-近邻法和剪辑近邻的设计过程,掌握影响k-近邻法错误率的估算因素等。

4.3 实验条件:

matlab软件

4.4 实验原理:

最近邻法可以扩展成找测试样本的k个最近样本作决策依据的方法。其基本规则是,在所有N个样本中找到与测试样本的k个最近邻者,其中各类别所占个数表示成ki,i?1,?,c则决策规划是:

如果kj(X)?maxki(X),i?1,?,c

i 则决策X∈?j (3-63)

k近邻一般采用k为奇数,跟投票表决一样,避免因两种票数相等而难以决策。

剪辑近邻法的基本思想是从这样一个现象出发的,即当不同类别的样本在分布上有交迭部分的,分类的错误率主要来自处于交迭区中的样本。当我们得到一个作为识别用的参考样本集时,由于不同类别交迭区域中不同类别的样本彼此穿插,导致用近邻法分类出错。因此如果能将不同类别交界处的样本以适当方式筛选,可以实现既减少样本数又提高正确识别率的双重目的。为此可以利用现有样本集对其自身进行剪辑。下面以两类别问题为例说明这种方法的原理。 假设现有一个样本集N,样本数量为N。我们将此样本集分成两个互相独立的样本子集。一个被当作考试集

aNT,另一个作为参考集aNR,数量分别为NT与NR,NT+NR=N。将aNTNR中的样本表示成Xi,(i?1,?,NT),而在a中的样本表示为Yj,(j?1,?,NR)。

将一个样本集分成两个相互独立的样本子集是指,分完以后的两个子集具有相同的分布例如将一个样本集分成两个相互独立的对等子集,则在每个特征空间的子区域,两个子集都有相同的比例,或说各类数量近似相等。要注意指出的是每个子区域(从大空间到小空间)实际做时

12

要用从总的集合中随机抽取的方式进行。 剪辑的过程是: 首先对aNT中每一个Xi在aNR中找到其最近邻的样本Yi(Xi),用Yi(Xi)表

NT示Yi是Xi的最近邻参考样本。如果Yi与Xi不属于同一类别,则将Xi从a中得到一个经过剪辑的样本集,称为剪辑样本集a考样本集对待识别样本进行分类。 aNTNTE中删除,最后从aNNT。aNTE可用来取代原样本集a,作为参

经过剪辑后,要作为新的训练样本集,则aNR是对其性能进行测试的样本,如发现aNT中的某个训练样本对分类不利,就要把它剪辑掉。 实际上剪辑样本的过程也可以用k-近邻法进行,即对aNT中的每个样本Xi,找到在aNR中

的k个近邻,用k-近邻法判断Xi是否被错分类。从而决定其取舍,其它过程与前述方法完全一样。

剪辑近邻法也可用到多类别情况。剪辑过程也可不止一次。重复多次的称为重复剪辑近邻法。

4.5 实验内容

如下面的matlab程序阐述的一样,有两个类别,x,y,样本的分布规律服从正态分布,其均值和方差分别为(2,2),(-2,4),每个类别里面分别有样本100个,如下面的数据所列(第一行为横坐标,相应的下一行对应的是纵坐标),图形所示

clear all close all

x = 2 + sqrt(2) * randn(2,100) y = -2 + sqrt(4) * randn(2,100) plot(x(1,:),x(2,:),'ro'); hold on

plot(y(1,:),y(2,:),'b*'); grid on

x1 = 1 + sqrt(2) * randn(2,2) y1 = -1 + sqrt(4) * randn(2,3) plot(x1(1,:),x1(2,:),'gs'); hold on

13

plot(y1(1,:),y1(2,:),'gd'); x =

Columns 1 through 8

2.3393 3.0777 1.8737 2.7339 2.3723 2.0607 2.7958 1.1613 4.0497 2.7254 2.9687 1.2959 0.4281 2.7207 1.9812 2.2180

Columns 9 through 16

1.5151 2.8422 0.6955 1.9956 -1.4693 3.1027 2.0873 1.5888 1.3233 1.8781 4.1631 1.6972 0.4532 0.6957 4.4584 2.4472

Columns 17 through 24

1.2210 2.7702 5.3554 2.5755 3.1579 1.4299 2.6070 0.5714 5.0188 1.7864 1.2680 1.4595 1.4049 2.2075 2.9997 2.4271

Columns 25 through 32

1.6260 2.3400 0.7291 1.4722 2.7524 3.1380 3.7800 0.9639 2.4397 2.5036 -0.1208 1.6814 0.1167 0.9358 0.9934 1.0406

Columns 33 through 40

1.6377 0.6335 0.5944 0.6900 2.7269 0.7390 -0.9497 2.2660 1.1267 0.9308 -0.2890 5.5362 1.9855 2.0577 0.2602 -2.1053

14