[模式识别]期末考试复习资料 联系客服

发布时间 : 星期日 文章[模式识别]期末考试复习资料更新完毕开始阅读05997b8f770bf78a64295434

模式识别期末考试

题型:

1.填空题5题 2.名词解释4题 3.问答题4题 4.计算作图题3题 5.综合计算题1题

备注1:没有整理第一章和第六章,老师说不考的 备注2:非线性判别函数相关概念P69

概率相关定义、性质、公式P83以后 最小错误率贝叶斯决策公式P85 最小风险贝叶斯P86 正态贝叶斯P90

综合计算有可能是第六次作业

一、填空题

物以类聚人以群分体现的是聚类分析的基本思想。

模式识别分类:1.从实现方法来分模式识别分为监督分类和非监督分类;2.从理论上来分,有统计模式识别,统计模式识别,模糊模式识别,神经网络模式识别法

聚类分析是按照不同对象之间的差异,根据距离函数的规律做模式分类的。 模式的特性:可观察性、可区分性、相似性

模式识别的任务:一是研究生物体(包括人)是如何感知对象的,二是如何用计算机实现模式识别的理论和方法。

计算机的发展方向:1.神经网络计算机--模拟人的大脑思维;2.生物计算机--运用生物工程技术、蛋白分子作芯片; 3.光计算机--用光作为信息载体,通过对光的处理来完成对信息的处理。 训练学习方法:监督学习、无监督学习(无先验知识,甚至类别数也未知)。

统计模式识别有:1.聚类分析法( 非监督);2.判决函数法/几何分类法(监督);3.基于统计决策的概率分类法 - 以模式集在特征空间中分布的类概率密度函数为基础,对总体特征进行研究,以取得分类的方法 数据的标准化目的:消除各个分量之间数值范围大小对算法的影响 模式识别系统的基本构成:书P7

聚类过程遵循的基本步骤:特征选择;近邻测度;聚类准则;聚类算法;结果验证;结果判定。 相似测度基础:以两矢量的方向是否相近作为考虑的基础,矢量长度并不重要。 确定聚类准则的两种方式: 阈值准则,函数准则

基于距离阈值的聚类算法——分解聚类:近邻聚类法;最大最小距离聚类法

类间距离计算准则:1)最短距离法2)最长距离法 3)中间距离法4)重心法5)类平均距离法6)离差平方和法P24 系统聚类法——合并的思想

用于随机模式分类识别的方法,通常称为贝叶斯判决。 BAYES 决策常用的准则:最小错误率;最小风险

错误率的计算或估计方法:①按理论公式计算;②计算错误率上界;③实验估计。

填空题

1

模式识别期末考试

1.名词解释 相似性测度:衡量模式之间相似性的一种尺度 明氏距离:P17当m=2时,明氏距离为欧氏距离。当m=1时:绝对距离( 曼哈顿距离 )称为“街坊”距离 感知器算法:就是通过训练样本模式的迭代和学习,产生线性(或广义线性)可分的模式判别函数。 梯度:P59 感知器P227 模糊度P182 清晰性P182 含混性 近似性 随机性

》》》》》》》

模式:对客体(研究对象)特征的描述(定量的或结构的),是取自客观世界的某一样本的测量值的集合(或综合)。模式所指的不是事物本身,而是从事物获得的信息。

模式识别:确定一个样本的类别属性(模式类)的过程,即把某一样本归属于多个类型中的某个类型。 模式类:具有某些共同特性的模式的集合。

特征选择:在原始特征基础上选择一些主要特征作为判别用的特征。

特征提取:采用某种变换技术,得出数目上比原来少的综合特征作为分类用。

特征抽取:通过各种手段从原始数据中得出反映分类问题的若干特征(有时需进行数据标准化) 特征空间:进行模式分类的空间。

特征向量:用 n 维列向量来表示 一个(模式)样本,说明该样本具有 n 个数字特征 x= (x1 , x2 , ?, xn)T 常称之为特征向量。

人工智能:是研究如何将人的智能转化为机器智能,或者是用机器来模拟或实现人的智能。 聚类分析:根据模式之间的相似性(相邻性)对模式进行分类,是一种非监督分类方法。

聚类准则:根据相似性测度确定的,衡量模式之间是否相似的标准。即把不同模式聚为一类还是归为不同类的准则——同一类模式相似程度的标准或不同类模式差异程度的标准。

名词解释 聚类准则函数:在聚类分析中,表示模式类内相似或类间差异性的函数。

相似度:衡量模式之间相似程度的尺度。

相似性测度:衡量模式之间相似性的一种尺度。 欧氏距离(简称距离):P15 马氏距离:P15

明氏距离:P17当m=2时,明氏距离为欧氏距离。当m=1时:绝对距离( 曼哈顿距离 )称为“街坊”距离

汉明(Hamming)距离:P17

判别函数:直接用来对模式进行分类的准则函数。

感知器算法:就是通过训练样本模式的迭代和学习,产生线性(或广义线性)可分的模式判别函数。 梯度:P59

分类器的正确率:指分类器正确分类的项目占所有被分类项目的比率。

过拟合:高维空间训练形成的分类器,相当于在低维空间的一个复杂的非线性分类器,这种分类器过多的强调了训练集

2

模式识别期末考试

的准确率甚至于对一些错误/异常的数据也进行了学习,而正确的数据却无法覆盖整个特征空间。为此,这样得到的分类器在对新数据进行预测时将会出现错误。这种现象称之为过拟合,同时也是维数灾难的直接体现。

3

模式识别期末考试

2.问答题

统计模式识别的优缺点: 主要优点:

1)比较成熟

2)能考虑干扰噪声等影响 3)识别模式基元能力强 主要缺点:

1)对结构复杂的模式抽取特征困难 2)不能反映模式的结构特征,难以描述模式的性质 3)难以从整体角度考虑识别问题 句法模式识别优缺点: 主要优点:

1)识别方便,可以从简单的基元开始,由简至繁。 2)能反映模式的结构特征,能描述模式的性质。 3)对图象畸变的抗干扰能力较强。 主要缺点:

当存在干扰及噪声时,抽取特征基元困难,且易失误。 模糊模式识别优缺点: 主要优点:

由于隶属度函数作为样本与模板间相似程度的度量,故往往能反映整体的与主体的特征,从而允许样本有相当程度的干扰与畸变。 主要缺点:

准确合理的隶属度函数往往难以建立,故限制了它的应用。 神经网络模式识别法优缺点: 主要优点:

可处理一些环境信息十分复杂,背景知识不清楚,推理规则不明确的问题。允许样本有较大的缺损、畸变。 主要缺点:

模型在不断丰富与完善中,目前能识别的模式类还不够多。 分类与聚类的区别:

分类:用已知类别的样本训练集来设计分类器(监督学习), 由学习过程和识别过程两部分组成,且用于学习的样本类别是已知的。

聚类(集群):事先不知样本的类别,而利用样本的先验知识来构造分类器(无监督学习)。 马氏距离的优缺点: 优点:

它不受量纲的影响,两点之间的马氏距离与原始数据的测量单位无关;

由标准化数据和中心化数据(即原始数据与均值之差)计算出的二点之间的马氏距离相同; 马氏距离还可以排除变量之间的相关性的干扰;

满足距离的四个基本公理:非负性、自反性、对称性和三角不等式。 缺点:

有可能夸大变化微小的变量的作用; 协方差不易计算

近邻聚类法优缺点: 优点:

计算简单(一种虽粗糙但快速的方法)。 局限性:

问答题

4