模式识别期末试题南京廖华

模式识别期末试题联系客服

发布时间 : 2024/6/8 11:23:45 星期六文章模式识别期末试题更新完毕开始阅读29f31ce7b52acfc788ebc919

一、填空与选择填空（本题答案写在此试卷上，30分）

1、模式识别系统的基本构成单元包括：模式采集、特征提取与选择和模式分类。

2、统计模式识别中描述模式的方法一般使用特真矢量；句法模式识别中模式描述方法一般有串、树、网。

3、聚类分析算法属于（1）；判别域代数界面方程法属于（3）。

（1）无监督分类 (2)有监督分类（3）统计模式识别方法（4）句法模式识别方法 4、若描述模式的特征量为0-1二值特征量，则一般采用（4）进行相似性度量。（1）距离测度（2）模糊测度（3）相似测度（4）匹配测度 5、下列函数可以作为聚类分析中的准则函数的有（1）（3）（4）。

（1）（2） (3)

(4)

6、Fisher线性判别函数的求解过程是将N维特征矢量投影在（2）中进行。（1）二维空间（2）一维空间（3）N-1维空间

7、下列判别域界面方程法中只适用于线性可分情况的算法有（1）；线性可分、不可分都适用的有（3）。

（1）感知器算法（2）H-K算法（3）积累位势函数法 8、下列四元组中满足文法定义的有（1）（2）（4）。

（1）({A, B}, {0, 1}, {A?01, A ? 0A1 , A ? 1A0 , B ? BA , B ? 0}, A) （2）({A}, {0, 1}, {A?0, A ? 0A}, A)

（3）({S}, {a, b}, {S ? 00S, S ? 11S, S ? 00, S ? 11}, S) （4）({A}, {0, 1}, {A?01, A ? 0A1, A ? 1A0}, A)

9、影响层次聚类算法结果的主要因素有（计算模式距离的测度、（聚类准则、类间距离门限、预定的

类别数目））。

10、欧式距离具有（ 1、2 ）；马式距离具有（ 1、2、3、4 ）。

（1）平移不变性（2）旋转不变性（3）尺度缩放不变性（4）不受量纲影响的特性

11、线性判别函数的正负和数值大小的几何意义是（正（负）表示样本点位于判别界面法向量指向的

正（负）半空间中；绝对值正比于样本点到判别界面的距离。）。 12、感知器算法 1 。

（1）只适用于线性可分的情况；（2）线性可分、不可分都适用。

第 1 页共 9 页

13、积累势函数法较之于H-K算法的优点是（该方法可用于非线性可分情况（也可用于线性可分情况））；

?K(x)?位势函数K(x,xk)与积累位势函数K(x)的关系为（

?~xk?X????kK(x,xk)）。

14、在统计模式分类问题中，聂曼-皮尔逊判决准则主要用于（某一种判决错误较另一种判决错误更

为重要）情况；最小最大判决准则主要用于（先验概率未知的）情况。

15、“特征个数越多越有利于分类”这种说法正确吗？（错误）。特征选择的主要目的是（从n个特征

中选出最有利于分类的的m个特征（m>n ）的条件下，可以使用分支定界法以减少计算量。

16、散度Jij越大，说明?i类模式与?j类模式的分布（差别越大）；当?i类模式与?j类模式的分

布相同时，Jij=（0）。

17、已知有限状态自动机Af=(?，Q，?，q0，F)，?={0，1}；Q={q0，q1}；?：?(q0，0)= q1，?(q0，1)= q1，?(q1，0)=q0，?(q1，1)=q0；q0=q0；F={q0}。现有输入字符串：(a) 00011101011，(b) 1100110011，(c) 101100111000，(d)0010011，试问，用Af对上述字符串进行分类的结果为（ ω1:{a,d};ω2:{b,c} ）。

18、影响聚类算法结果的主要因素有（ ②③④ ）。

①已知类别的样本质量；②分类准则；③特征选取；④模式相似性测度。 19、模式识别中，马式距离较之于欧式距离的优点是（ ③④ ）。 ①平移不变性；②旋转不变性；③尺度不变性；④考虑了模式的分布。 20、基于二次准则函数的H-K算法较之于感知器算法的优点是（ ①③ ）。

①可以判别问题是否线性可分；②其解完全适用于非线性可分的情况； ③其解的适应性更好；④计算量小。

21、影响基本C均值算法的主要因素有（ ④①② ）。

①样本输入顺序；②模式相似性测度；③聚类准则；④初始类心的选取。 22、位势函数法的积累势函数K(x)的作用相当于Bayes判决中的（ ②④ ）。 ①先验概率；②后验概率；③类概率密度；④类概率密度与先验概率的乘积。 23、在统计模式分类问题中，当先验概率未知时，可以使用（ ②④ ）。

①最小损失准则；②最小最大损失准则；③最小误判概率准则；④N-P判决。 24、在（ ①③ ）情况下，用分支定界法做特征选择计算量相对较少。

①Cn>>n,（n为原特征个数，d为要选出的特征个数）；②样本较多；③选用的可分性判据J对特征数目单调不减；④选用的可分性判据J具有可加性。

第 2 页共 9 页

25、散度JD是根据（ ③ ）构造的可分性判据。

①先验概率；②后验概率；③类概率密度；④信息熵；⑤几何距离。 26、似然函数的概型已知且为单峰，则可用（ ①②③④⑤ ）估计该似然函数。

①矩估计；②最大似然估计；③Bayes估计；④Bayes学习；⑤Parzen窗法。 27、Kn近邻元法较之Parzen窗法的优点是（ ② ）。

①所需样本数较少；②稳定性较好；③分辨率较高；④连续性较好。 28、从分类的角度讲，用DKLT做特征提取主要利用了DKLT的性质：（ ①③ ）。

①变换产生的新分量正交或不相关；②以部分新的分量表示原矢量均方误差最小；③使变换后的矢量能量更趋集中；

29、一般，剪辑k-NN最近邻方法在（ ① ）的情况下效果较好。

①样本数较大；②样本数较小；③样本呈团状分布；④样本呈链状分布。

30、如果以特征向量的相关系数作为模式相似性测度，则影响聚类算法结果的主要因素有（ ②③ ）。

①已知类别样本质量；②分类准则；③特征选取；④量纲。二、(15分)简答及证明题

（1）影响聚类结果的主要因素有那些？

（2）证明马氏距离是平移不变的、非奇异线性变换不变的。答：（1）分类准则，模式相似性测度，特征量的选择，量纲。（2）证明：

(2分)

(1分)

三、(8分)说明线性判别函数的正负和数值大小在分类中的意义并证明之。答：（1）（4分）数绝对值，上式表明，

的绝对值

的值

正比于到超平面正比于到超平面

的距离的距离

式(1-1)的分子为判别函，一个特征矢量代入判别

函数后所得值的绝对值越大表明该特征点距判别界面越远。

（2）（4分）判别函数值的正负表示出特征点位于哪个半空间中，或者换句话说，表示特征点位于界面的哪一侧。

第 3 页共 9 页

四、(12分，每问4分) 在目标识别中，假定有农田和装甲车两种类型，类型?1和类型?2分别代表农田和装甲车，它们的先验概率分别为0.8和0.2，损失函数如表1所示。现在做了三次试验，获得三个样本的类概率密度如下：

：0.3，0.1，0.6 ：0.7，0.8，0.3

（1）试用贝叶斯最小误判概率准则判决三个样本各属于哪一个类型；

（2）假定只考虑前两种判决，试用贝叶斯最小风险准则判决三个样本各属于哪一类；（3）把拒绝判决考虑在内，重新考核三次试验的结果。表1

类型损失判决 ?1 1 5 1 4 1 1 ?1

解：由题可知：，，，

，

（1）（4分）根据贝叶斯最小误判概率准则知：

，则可以任判；，则判为；，则判为；

（2）（4分）由题可知：

则，判为；

，判为；

第 4 页共 9 页

Word文档下载：模式识别期末试题.doc

搜索更多:模式识别期末试题