[模式识别]期末考试复习资料南京廖华

[模式识别]期末考试复习资料联系客服

发布时间 : 2024/4/28 18:04:51 星期日文章[模式识别]期末考试复习资料更新完毕开始阅读05997b8f770bf78a64295434

模式识别期末考试

题型：

1.填空题5题 2.名词解释4题 3.问答题4题 4.计算作图题3题 5.综合计算题1题

备注1：没有整理第一章和第六章，老师说不考的备注2：非线性判别函数相关概念P69

概率相关定义、性质、公式P83以后最小错误率贝叶斯决策公式P85 最小风险贝叶斯P86 正态贝叶斯P90

综合计算有可能是第六次作业

一、填空题

物以类聚人以群分体现的是聚类分析的基本思想。

模式识别分类：1.从实现方法来分模式识别分为监督分类和非监督分类；2.从理论上来分，有统计模式识别，统计模式识别，模糊模式识别，神经网络模式识别法

聚类分析是按照不同对象之间的差异，根据距离函数的规律做模式分类的。模式的特性：可观察性、可区分性、相似性

模式识别的任务：一是研究生物体（包括人）是如何感知对象的，二是如何用计算机实现模式识别的理论和方法。

计算机的发展方向：1.神经网络计算机－－模拟人的大脑思维；2.生物计算机－－运用生物工程技术、蛋白分子作芯片； 3.光计算机－－用光作为信息载体，通过对光的处理来完成对信息的处理。训练学习方法：监督学习、无监督学习（无先验知识，甚至类别数也未知）。

统计模式识别有：1.聚类分析法（非监督）；2.判决函数法/几何分类法(监督)；3.基于统计决策的概率分类法 - 以模式集在特征空间中分布的类概率密度函数为基础，对总体特征进行研究，以取得分类的方法数据的标准化目的：消除各个分量之间数值范围大小对算法的影响模式识别系统的基本构成：书P7

聚类过程遵循的基本步骤：特征选择；近邻测度；聚类准则；聚类算法；结果验证；结果判定。相似测度基础：以两矢量的方向是否相近作为考虑的基础,矢量长度并不重要。确定聚类准则的两种方式：阈值准则，函数准则

基于距离阈值的聚类算法——分解聚类：近邻聚类法；最大最小距离聚类法

类间距离计算准则:1）最短距离法2）最长距离法 3）中间距离法4）重心法5）类平均距离法6）离差平方和法P24 系统聚类法——合并的思想

用于随机模式分类识别的方法，通常称为贝叶斯判决。 BAYES 决策常用的准则：最小错误率；最小风险

错误率的计算或估计方法：①按理论公式计算；②计算错误率上界；③实验估计。

填空题

模式识别期末考试

1.名词解释相似性测度：衡量模式之间相似性的一种尺度明氏距离：P17当m=2时，明氏距离为欧氏距离。当m=1时：绝对距离（曼哈顿距离）称为“街坊”距离感知器算法：就是通过训练样本模式的迭代和学习，产生线性（或广义线性）可分的模式判别函数。梯度：P59 感知器P227 模糊度P182 清晰性P182 含混性近似性随机性

》》》》》》》

模式：对客体（研究对象）特征的描述（定量的或结构的），是取自客观世界的某一样本的测量值的集合（或综合）。模式所指的不是事物本身，而是从事物获得的信息。

模式识别：确定一个样本的类别属性（模式类）的过程，即把某一样本归属于多个类型中的某个类型。模式类：具有某些共同特性的模式的集合。

特征选择：在原始特征基础上选择一些主要特征作为判别用的特征。

特征提取：采用某种变换技术，得出数目上比原来少的综合特征作为分类用。

特征抽取：通过各种手段从原始数据中得出反映分类问题的若干特征（有时需进行数据标准化）特征空间：进行模式分类的空间。

特征向量：用 n 维列向量来表示一个（模式）样本，说明该样本具有 n 个数字特征 x= (x1 , x2 , ?, xn)T 常称之为特征向量。

人工智能：是研究如何将人的智能转化为机器智能，或者是用机器来模拟或实现人的智能。聚类分析：根据模式之间的相似性（相邻性）对模式进行分类，是一种非监督分类方法。

聚类准则：根据相似性测度确定的，衡量模式之间是否相似的标准。即把不同模式聚为一类还是归为不同类的准则——同一类模式相似程度的标准或不同类模式差异程度的标准。

名词解释聚类准则函数：在聚类分析中，表示模式类内相似或类间差异性的函数。

相似度：衡量模式之间相似程度的尺度。

相似性测度：衡量模式之间相似性的一种尺度。欧氏距离（简称距离）：P15 马氏距离：P15

明氏距离：P17当m=2时，明氏距离为欧氏距离。当m=1时：绝对距离（曼哈顿距离）称为“街坊”距离

汉明(Hamming)距离:P17

判别函数：直接用来对模式进行分类的准则函数。

感知器算法：就是通过训练样本模式的迭代和学习，产生线性（或广义线性）可分的模式判别函数。梯度：P59

分类器的正确率：指分类器正确分类的项目占所有被分类项目的比率。

过拟合：高维空间训练形成的分类器，相当于在低维空间的一个复杂的非线性分类器，这种分类器过多的强调了训练集

模式识别期末考试

的准确率甚至于对一些错误/异常的数据也进行了学习，而正确的数据却无法覆盖整个特征空间。为此，这样得到的分类器在对新数据进行预测时将会出现错误。这种现象称之为过拟合，同时也是维数灾难的直接体现。

模式识别期末考试

2.问答题

统计模式识别的优缺点：主要优点：

1）比较成熟

2）能考虑干扰噪声等影响 3）识别模式基元能力强主要缺点：

1）对结构复杂的模式抽取特征困难 2）不能反映模式的结构特征，难以描述模式的性质 3）难以从整体角度考虑识别问题句法模式识别优缺点：主要优点：

1）识别方便，可以从简单的基元开始，由简至繁。 2）能反映模式的结构特征，能描述模式的性质。 3）对图象畸变的抗干扰能力较强。主要缺点：

当存在干扰及噪声时，抽取特征基元困难，且易失误。模糊模式识别优缺点：主要优点：

由于隶属度函数作为样本与模板间相似程度的度量，故往往能反映整体的与主体的特征，从而允许样本有相当程度的干扰与畸变。主要缺点：

准确合理的隶属度函数往往难以建立，故限制了它的应用。神经网络模式识别法优缺点：主要优点：

可处理一些环境信息十分复杂，背景知识不清楚，推理规则不明确的问题。允许样本有较大的缺损、畸变。主要缺点：

模型在不断丰富与完善中，目前能识别的模式类还不够多。分类与聚类的区别：

分类：用已知类别的样本训练集来设计分类器（监督学习）, 由学习过程和识别过程两部分组成，且用于学习的样本类别是已知的。

聚类（集群）：事先不知样本的类别，而利用样本的先验知识来构造分类器（无监督学习）。马氏距离的优缺点：优点：

它不受量纲的影响，两点之间的马氏距离与原始数据的测量单位无关；

由标准化数据和中心化数据（即原始数据与均值之差）计算出的二点之间的马氏距离相同；马氏距离还可以排除变量之间的相关性的干扰；

满足距离的四个基本公理：非负性、自反性、对称性和三角不等式。缺点：

有可能夸大变化微小的变量的作用；协方差不易计算

近邻聚类法优缺点：优点：

计算简单（一种虽粗糙但快速的方法）。局限性：

问答题

Word文档下载：[模式识别]期末考试复习资料.doc

搜索更多:[模式识别]期末考试复习资料