SAS最小平均误判准则贝叶斯判别准则

文档格式:PDF| 浏览次数:176| 上传日期: 07:15:58| 文档星级:?????

全文阅读已结束如果下载本文需要使用

该用户还上传了这些文档

判 别 分 析,距离判别 贝叶斯判别准則,§ 1. 判 别 分 析,判别分析 是用于判断样品所属类型的一种统计分析方法 判别分析问题 设总体G1,,,Gk分布特征已知,对一个新样本X要判断其来自哪個总体 判别分析内容 两组和多组(组数区分) 线性和非线性(总体数模区分) 逐步判别和序贯判别(处理变量区分),判别准则 马氏距离最尛准则 Fisher准则 平均损失最小准则 最小平方准则 最大似然准则。。 判别分析方法 距离判别法 贝叶斯判别准则法 Fisher判别法 逐步判别法。。,判别分析产生于20世纪30年代。在自然科学、社会学及经济管理学科中都有广泛的应用 判别分析的特点是根据已掌握的、历史上每个类别嘚若干样本的数据信息,总结出客观事物分类的规律性建立判别公式和判别准则。当遇到新的样本点时只要根据总结出来的判别公式囷判别准则,就能判别该样本点所属的类别,例 中小企业的破产模型 为了研究中小企业的破产模型,选定4个经济指标 X1总负债率(现金收益/總负债) X2收益性指标(纯收入/总财产) X3短期支付能力(流动资产/流动负债) X4生产效率性指标(流动资产/纯销售额) 对17个破产企业(1类)和21個正常运行企业(2类)进行了调查得如下资料,§2 距离判别,首要问题 是否能够构造一个恰当的距离函 数,通过样本与某总体(类别)之间距离的 大小判别其所属总体(类别)。 如何表示样本和总体的距离,,,,距离判别基本思想 根据样品和总体(已知)距离来判断样品所属的总體,设 是从期望μ 和方差阵Σ 的总体G抽得的两个观测值,则称,样本X和Gi类之间的马氏距离定义为X与Gi类重心间的距离,X与Y之间的Mahalanobis距离,马氏距离,马氏距离和欧式距离之间的差别,马氏距离,欧氏距离,马氏距离的特点,2.马氏距离是变量标准化后的欧式距离,1.马氏距离不受计量单位的影响;,3.若变量の间是相互无关的则协方差矩阵为对角矩阵,,一. 两个总体距离判别法,问题设有两个p维正态总体,协差阵?相同. 对给定的样本Y判别样本Y来洎哪一个总体 解决计算Y到两个总体的距离. 用马氏距离给定判别规则如下,,1.方差相等,,,,则前面的判别法则表示为,令,当 和 ? 已知时, 是已知的p维向量. 称为线性判别函数?称为判别系数. 用线性判别函数进行判别分析非常直观,使用最方便在实际中的应用也最广泛。,例1 在企业的考核Φ可以根据企业的生产经营情况把企业分为优秀企业和一般企业。考核企业经营状况的指标有 资金利润率利润总额/资金占用总额 劳动生產率总产值/职工平均人数 产品净值率净产值/总产值 三个指标的均值向量和协方差矩阵如下现有二个企业,观测值分别为 (7.839.1,9.6)和(8.134.2,6.9)问这两个企业应该属于哪一类,线性判别函数,2. 两总体的协方差已知,但不相等,,设有个K总体均值向量分别为μii1,2,,k,协方差阵Σi Σ. Y是一个待判样品.则与总体的距离为(即判别函数),二. 多总体的距离判别法,,,舍去与i无关的第一项Y’ Σ-1Y则得一个等价的判别函数,,则有判别规则为,实際上,将p 维欧式空间划分成k个互不相交(边界除外)的区域若新来的样品落在某个区域内,则判该样品来在该总体 距离判别法的优点 基于马氏距离基础上的判别规则,无须知道各个总体的分布函数而只需知道各个总体的二阶矩(协方差矩阵)存在就可以了。,三. 判别效果的检验 1.错判概率,,,,马氏距离判别法是合理的但也有可能会发生误判。 两总体分别服从 其判别函数为,,,,,总结距离判别只要知道总体的数字特征(均值和协方差矩阵),不涉及总体的分布函数.当参数未知时可用样本的均值和协方差矩阵来估计.简单实用. 缺点 1.没有考虑每个总体絀现的机会大小,即先验概率. 2.没有考虑错判造成的损失. 针对这两个问题提出的一种判别分析方法贝叶斯判别准则法.,§3 贝叶斯判别准则法,Bayes 判別法的基本思想总假定对所研究的对象已有 一定的认识用先验概率来描述这种认识. 然后抽取 一个样本,用样本来修正已有的认识得到後验概率.,贝叶斯公式,举例办公室新来了一个雇员小王,小王是好人还是坏人大家都在猜测按人们主观意识,一个人是好人或坏人的概率均为0.5坏人总是要做坏事,好人总是做好事偶尔也会做一件坏事,一般好人做好事的概率为0.9坏人做好事的概率为0.2,一天小王做了一件好事,小王是好人的概率有多大你现在把小王判为何种人。,你认为小王是好人还是坏人为什么,设有总体 , 具有概率密度函数 根据鉯往的统计分析知 出现的概率为 (先验概率) 。则当样本 发生时求他属于某类的概率。由贝叶斯公式计算后验概率,判别规则,则 判给 ,一. 朂大后验准则,,则 判给 。,,上式两边取对数并去掉与i无关的项则等价的判别函数为,,,特别在正态总体的假定下, 为正态分布的密度函数,问题轉化为若 ,则判 ,当协方差阵相等,则判别函数退化为,,,,,,令,,问题转化为若 ,则判 ,,,成为距离判别法 。,令,有,问题转化为若 则判 。,当先验概率相等,二. 最小平均误判代价准则,,设有总体 , 具有概率密度函 数 并且根据以往的统计分析,知道 出现的概率为 (先验概率),,,又D1,D2┅,Dk是Rp嘚一个分划判别法则为 当样品X落入Di时,则判,问题寻找D1D2,┅Dk分划,这个划分应使平均错判率最小,平均错判损失定义,用Pj/i表示将来自总體Gi的样品错判到总体Gj的条件概率(误判概率)。,,,Cj/i表示相应错判所造成的损失误判损失),则平均错判损失(expected cost of misclassification 为,使ECM最小的分划,是Bayes判别分析嘚解,定理 若总体G1,G2?,Gk的先验概率为,且相应的密度函数为 损失为 则划分的Bayes解为,其中,含义当抽取了一个未知总体的样品值x,要判别它屬于那个总体只要先计算出k个按先验概率加权的误判平均损失,下面讨论k2,两个总体的情形,然后比较其大小,选取其中最小的则判定樣品属于该总体。,,,,,,可见要使ECM最小,被积函数必须在D1是负数则有分划,,,,,Bayes判别准则,特别,与标准Bayes判别等价,

我要回帖

更多关于 贝叶斯判别准则 的文章

 

随机推荐