主要内容

optimalleaforder

层次聚类的最优叶子排序

描述

例子

leafOrder= optimalleaforder (D返回层次二叉集群树的最优叶子排序,,利用距离,D.二叉树的最优叶序通过不划分簇而翻转树枝,使相邻叶之间的相似性和最大化。

leafOrder= optimalleaforder (D名称,值使用一个或多个名称-值对参数返回最优的叶序。

例子

全部折叠

使用链接.然后,将具有默认排序的树状图与具有最优叶子排序的树状图进行比较。

生成样本数据。

rng (“默认”%的再现性X =兰德(10,2);

创建一个距离向量和一个层次二叉聚类树。利用距离和聚类树来确定最优叶序。

D = pdist (X);树=连杆(D,“平均”);leafOrder = optimalleaforder(树,D);

绘制具有默认排序的树状图和具有最优叶子排序的树状图。

图()子图(2,1,1)树形图(树)标题(“默认叶秩序”次要情节(2,1,2)系统树图(树,“重新排序”leafOrder)标题(“最佳叶片秩序”

图中包含2个轴对象。标题为Default Leaf Order的轴对象1包含9个类型为line的对象。标题为“最佳叶子顺序”的轴对象2包含9个类型为line的对象。

下图中叶子的顺序对应于里面的元素leafOrder

leafOrder
leafOrder =1×101 4 9 10 2 5 8 3 7 6

生成样本数据。

rng (“默认”%的再现性X =兰德(10,2);

创建一个距离向量和一个层次二叉聚类树。

D = pdist (X);树=连杆(D,“平均”);

使用反距离相似变换确定最优叶序。

leafOrder = optimalleaforder(树,D,“转换”“逆”
leafOrder =1×101 4 9 10 2 5 8 3 7 6

输入参数

全部折叠

层次二叉聚类树,指定为- 1)你使用生成的- × 3矩阵链接,在那里为叶节点的个数。

确定叶子之间相似性的距离,指定为距离的矩阵或向量。例如,您可以使用pdist

名称-值参数

指定可选的逗号分隔的对名称,值参数。的名字参数名和价值为对应值。的名字必须出现在引号内。可以以任意顺序指定多个名称和值对参数Name1, Value1,…,的家

例子:“标准”、“组织”、“转换”,“逆”使用逆相似变换,指定在相邻集群中的每个叶子和所有其他叶子之间相似性的总和被最大化。

确定最优叶子排序的优化准则,指定为逗号分隔对,由“标准”其中一个价值观是:

“附近” 使相邻叶之间的相似性总和最大化。
“集团” 在树状图的同一层次上,使每一片叶子和相邻簇中所有其他叶子之间的相似性总和最大化。

例子:“标准”、“组织”

将距离转换为相似点的方法,指定为逗号分隔的对,由“转换”其中一个“线性”“逆”,或函数句柄。

d我,我Sim卡我,我表示树叶之间的距离和相似性j,分别。包含的相似变换为:

“线性” Sim卡我,我=最大我,我d我,我) - - -d我,我
“逆” Sim卡我,我= 1 /d我,我

若要使用自定义转换函数,请指定接受距离矩阵的函数句柄,D,返回一个相似点矩阵,年代.函数在距离值的范围内应该是单调递减的。年代必须和D,S (i, j)为计算基于的相似度D (i, j)

例子:“转换”,@myTransform

输出参数

全部折叠

最优叶子顺序,返回长度-向量,为叶节点的个数。leafOrder是向量的排列吗1: M,给出了基于指定的距离和相似变换的最优叶子排序。

参考文献

[1] Bar-Joseph, Z., Gifford, d.k.和Jaakkola, T.S.(2001)。“快速最优叶子排序层次聚类。”生物信息学第17卷,增刊1:S22-9。PMID: 11472989。

另请参阅

||

介绍了R2012b