Matlabによる機械学習

利用k -均值和自组织映射的聚类基因

这个例子展示了两种方法,通过检查从发酵到呼吸的代谢转变的酵母的基因表达数据来寻找基因表达谱的模式。

方法中的数据和函数生物信息工具箱™

加载数据

负载filteredyeastdatarng (“默认”%用于再现性

本例的可用信息包括酵母基因及其在酵母中的表达水平yeastvalues在不同的时间。

用层次聚类树聚类基因

集群= clusterdata(yeastvalues,“maxclust”, 16岁,“距离”“相关”“链接”“平均”);图(1)C = 1:16 subplot(4,4, C);Plot (times,yeastvalues((clusters == c),:)');轴结束suptitle (“档案的层次聚类”);

利用主成分分析和K-Means进行低维聚类

图(2)[~,score,~,~,explainedVar] = pca(yeastvalues);标题栏(explainedVar) (“解释方差:90%以上由前两个主成分解释”) ylabel (“电脑”保留前两个主要成分yeastPC = score(:,1:2);图(3)[clusters, centroid] = kmeans(yeastPC,6);gscatter (yeastPC (: 1) yeastPC(:, 2),集群)传说(“位置”“东南”)包含(“第一主成分”);ylabel (“第二主成分”);标题(彩色簇主成分散点图);在每个簇中标记一个基因[~, r] =唯一的(集群);文本(yeastPC (r, 1), yeastPC (r, 2),基因(r),“字形大小”11);

利用主成分分析和自组织图进行低维聚类

的自组织映射功能深度学习工具箱™。

net = newsom(yeastPC',[4 4]);net = train(net,yeastPC');距离= dist(yeastPC,net.IW{1}');[d,center] = min(距离,[],2);% center给出群集索引图gscatter (yeastPC (: 1), yeastPC(:, 2),中心);传说;持有net.layers plotsom (net.iw {1}, {1} .distances);持有

这个例子探讨了聚类基因的两种不同方法。如需更全面的演示,请访问我们的基因表达谱分析文档。