利用k -均值和自组织映射的聚类基因
这个例子展示了两种方法,通过检查从发酵到呼吸的代谢转变的酵母的基因表达数据来寻找基因表达谱的模式。
方法中的数据和函数生物信息工具箱™.
负载filteredyeastdatarng (“默认”)%用于再现性
本例的可用信息包括酵母基因及其在酵母中的表达水平yeastvalues
在不同的时间。
集群= clusterdata(yeastvalues,“maxclust”, 16岁,“距离”,“相关”,“链接”,“平均”);图(1)为C = 1:16 subplot(4,4, C);Plot (times,yeastvalues((clusters == c),:)');轴紧结束suptitle (“档案的层次聚类”);
图(2)[~,score,~,~,explainedVar] = pca(yeastvalues);标题栏(explainedVar) (“解释方差:90%以上由前两个主成分解释”) ylabel (“电脑”)保留前两个主要成分yeastPC = score(:,1:2);图(3)[clusters, centroid] = kmeans(yeastPC,6);gscatter (yeastPC (: 1) yeastPC(:, 2),集群)传说(“位置”,“东南”)包含(“第一主成分”);ylabel (“第二主成分”);标题(彩色簇主成分散点图);在每个簇中标记一个基因[~, r] =唯一的(集群);文本(yeastPC (r, 1), yeastPC (r, 2),基因(r),“字形大小”11);
的自组织映射功能深度学习工具箱™。
net = newsom(yeastPC',[4 4]);net = train(net,yeastPC');距离= dist(yeastPC,net.IW{1}');[d,center] = min(距离,[],2);% center给出群集索引图gscatter (yeastPC (: 1), yeastPC(:, 2),中心);传说从;持有在net.layers plotsom (net.iw {1}, {1} .distances);持有从
这个例子探讨了聚类基因的两种不同方法。如需更全面的演示,请访问我们的基因表达谱分析文档。