发布时间 : 星期六 文章模式识别期末试题更新完毕开始阅读29f31ce7b52acfc788ebc919
一、 填空与选择填空(本题答案写在此试卷上,30分)
1、模式识别系统的基本构成单元包括: 模式采集 、 特征提取与选择 和 模式分类 。
2、统计模式识别中描述模式的方法一般使用 特真矢量 ;句法模式识别中模式描述方法一般有 串 、 树 、 网 。
3、聚类分析算法属于 (1) ;判别域代数界面方程法属于 (3) 。
(1)无监督分类 (2)有监督分类 (3)统计模式识别方法(4)句法模式识别方法 4、若描述模式的特征量为0-1二值特征量,则一般采用 (4) 进行相似性度量。 (1)距离测度 (2)模糊测度 (3)相似测度 (4)匹配测度 5、 下列函数可以作为聚类分析中的准则函数的有 (1)(3)(4) 。
(1) (2) (3)
(4)
6、Fisher线性判别函数的求解过程是将N维特征矢量投影在 (2) 中进行 。 (1)二维空间 (2)一维空间 (3)N-1维空间
7、下列判别域界面方程法中只适用于线性可分情况的算法有 (1) ;线性可分、不可分都适用的有 (3) 。
(1)感知器算法 (2)H-K算法 (3)积累位势函数法 8、下列四元组中满足文法定义的有 (1)(2)(4) 。
(1)({A, B}, {0, 1}, {A?01, A ? 0A1 , A ? 1A0 , B ? BA , B ? 0}, A) (2)({A}, {0, 1}, {A?0, A ? 0A}, A)
(3)({S}, {a, b}, {S ? 00S, S ? 11S, S ? 00, S ? 11}, S) (4)({A}, {0, 1}, {A?01, A ? 0A1, A ? 1A0}, A)
9、影响层次聚类算法结果的主要因素有( 计算模式距离的测度、(聚类准则、类间距离门限、预定的
类别数目))。
10、欧式距离具有( 1、2 );马式距离具有( 1、2、3、4 )。
(1)平移不变性(2)旋转不变性(3)尺度缩放不变性(4)不受量纲影响的特性
11、线性判别函数的正负和数值大小的几何意义是(正(负)表示样本点位于判别界面法向量指向的
正(负)半空间中;绝对值正比于样本点到判别界面的距离。)。 12、感知器算法 1 。
(1)只适用于线性可分的情况;(2)线性可分、不可分都适用。
第 1 页 共 9 页
13、积累势函数法较之于H-K算法的优点是(该方法可用于非线性可分情况(也可用于线性可分情况) );
?K(x)?位势函数K(x,xk)与积累位势函数K(x)的关系为(
?~xk?X????kK(x,xk))。
14、在统计模式分类问题中,聂曼-皮尔逊判决准则主要用于( 某一种判决错误较另一种判决错误更
为重要)情况;最小最大判决准则主要用于( 先验概率未知的)情况。
15、“特征个数越多越有利于分类”这种说法正确吗?( 错误 )。特征选择的主要目的是(从n个特征
中选出最有利于分类的的m个特征(m
16、 散度Jij越大,说明?i类模式与?j类模式的分布(差别越大);当?i类模式与?j类模式的分
布相同时,Jij=(0)。
17、 已知有限状态自动机Af=(?,Q,?,q0,F),?={0,1};Q={q0,q1};?:?(q0,0)= q1,?(q0,1)= q1,?(q1,0)=q0,?(q1,1)=q0;q0=q0;F={q0}。现有输入字符串:(a) 00011101011,(b) 1100110011,(c) 101100111000,(d)0010011,试问,用Af对上述字符串进行分类的结果为( ω1:{a,d};ω2:{b,c} )。
18、影响聚类算法结果的主要因素有( ②③④ )。
①已知类别的样本质量;②分类准则;③特征选取;④模式相似性测度。 19、模式识别中,马式距离较之于欧式距离的优点是( ③④ )。 ①平移不变性;②旋转不变性;③尺度不变性;④考虑了模式的分布。 20、基于二次准则函数的H-K算法较之于感知器算法的优点是( ①③ )。
①可以判别问题是否线性可分;②其解完全适用于非线性可分的情况; ③其解的适应性更好;④计算量小。
21、影响基本C均值算法的主要因素有( ④①② )。
①样本输入顺序;②模式相似性测度;③聚类准则;④初始类心的选取。 22、位势函数法的积累势函数K(x)的作用相当于Bayes判决中的( ②④ )。 ①先验概率;②后验概率;③类概率密度;④类概率密度与先验概率的乘积。 23、在统计模式分类问题中,当先验概率未知时,可以使用( ②④ )。
①最小损失准则;②最小最大损失准则;③最小误判概率准则;④N-P判决。 24、在( ①③ )情况下,用分支定界法做特征选择计算量相对较少。
①Cn>>n,(n为原特征个数,d为要选出的特征个数);②样本较多;③选用的可分性判据J对特征数目单调不减;④选用的可分性判据J具有可加性。
第 2 页 共 9 页
d
m
25、 散度JD是根据( ③ )构造的可分性判据。
①先验概率;②后验概率;③类概率密度;④信息熵;⑤几何距离。 26、似然函数的概型已知且为单峰,则可用( ①②③④⑤ )估计该似然函数。
①矩估计;②最大似然估计;③Bayes估计;④Bayes学习;⑤Parzen窗法。 27、Kn近邻元法较之Parzen窗法的优点是( ② )。
①所需样本数较少;②稳定性较好;③分辨率较高;④连续性较好。 28、从分类的角度讲,用DKLT做特征提取主要利用了DKLT的性质:( ①③ )。
①变换产生的新分量正交或不相关;②以部分新的分量表示原矢量均方误差最小;③使变换后的矢量能量更趋集中;
29、一般,剪辑k-NN最近邻方法在( ① )的情况下效果较好。
①样本数较大;②样本数较小;③样本呈团状分布;④样本呈链状分布。
30、如果以特征向量的相关系数作为模式相似性测度,则影响聚类算法结果的主要因素有( ②③ )。
①已知类别样本质量;②分类准则;③特征选取;④量纲。 二、(15分)简答及证明题
(1)影响聚类结果的主要因素有那些?
(2)证明马氏距离是平移不变的、非奇异线性变换不变的。 答:(1)分类准则,模式相似性测度,特征量的选择,量纲。 (2)证明:
(2分)
(2分)
(1分)
三、(8分)说明线性判别函数的正负和数值大小在分类中的意义并证明之。 答:(1)(4分)数绝对值,上式表明,
的绝对值
的值
正比于到超平面正比于到超平面
的距离的距离
式(1-1)的分子为判别函,一个特征矢量代入判别
函数后所得值的绝对值越大表明该特征点距判别界面越远。
(2)(4分)判别函数值的正负表示出特征点位于哪个半空间中,或者换句话说,表示特征点位于界面的哪一侧。
第 3 页 共 9 页
四、(12分,每问4分) 在目标识别中,假定有农田和装甲车两种类型,类型?1和类型?2分别代表农田和装甲车,它们的先验概率分别为0.8和0.2,损失函数如表1所示。现在做了三次试验,获得三个样本的类概率密度如下:
:0.3,0.1,0.6 :0.7,0.8,0.3
(1) 试用贝叶斯最小误判概率准则判决三个样本各属于哪一个类型;
(2) 假定只考虑前两种判决,试用贝叶斯最小风险准则判决三个样本各属于哪一类; (3) 把拒绝判决考虑在内,重新考核三次试验的结果。 表1
类型 损失 判决 ?1 1 5 1 4 1 1 ?1
解:由题可知:,,,
,
(1)(4分)根据贝叶斯最小误判概率准则知:
,则可以任判;,则判为;,则判为;
(2)(4分)由题可知:
则 ,判为;
,判为;
,判为;
第 4 页 共 9 页