Matlab提供了两种方法进行聚类分析
┅种是利用 clusterdata函数对样本数据进行一次聚类,其缺点为可供用户选择的面较窄不能更改距离的计算方法;
另一种是分步聚类:(1)找到数據集合中变量两两之间的相似性和非相似性,用pdist函数计算变量之间的距离;(2)用 linkage函数定义变量之间的连接;(3)用 cophenetic函数评价聚类信息;(4)用cluster函数创建聚类
1.Matlab中相关函数介绍
的距离方阵由于该方阵是对称嘚,令对角线上的元素为0所以取此方阵的下三角元素,按照Matlab中矩阵的按列存储原则此下三角各元素的索引排列即为(2,1), (3,1), ..., (m,1), (3,2), ..., (m,2), ..., (m,m–1).可以用命令
1)马氏距离的计算是建立在总体样本的基础上的,因为C是由总样本计算而来所以马氏距离的计算是不稳定的;
2)在计算马氏距离过程中,要求总体样本数大于样本的维数
3)协方差矩阵的逆矩阵可能不存在。