群归类数值数据

注意

公称序数词不推荐组数据类型。代表有序和无序的离散,非数值数据,使用分类数组(MATLAB)数据类型来代替。

群归类数值数据

这个例子展示了如何使用数字数据归类到一个分类顺序排列序数词。这是离散的连续数据是有用的。

加载样本数据。

数据集阵列,医院包含对患者的样品进行测定的变量。计算最小值,中值和变量的最大年龄

加载医院分位数(hospital.Age,[0,.5,1])
ANS =1×325 39 50

患者年龄范围从25到50。

转换一个数字阵列的序阵列。

组患者分为年龄种类在3030-39在40

hospital.AgeCat =序(hospital.Age,{“在30”'30 -39'“在40”},...[],[25,30,40,50]);getlevels(hospital.AgeCat)
ANS =1×3的序在30 30-39 40以上

最后输入的参数序数词有类别的端点。第一类开始于25岁,该第二30岁,等等。最后一类包含40岁及以上,所以在40和端部开始于50(最大年龄在数据集中)。要指定三大类,你必须指定四个端点(最后的终点是上界的最后一类的)。

探索类别。

显示年龄和年龄段关于第二患者。

数据集({hospital.Age(2),'年龄'},...{hospital.AgeCat(2),'AgeCategory'})
ANS =年龄AgeCategory 43超过四

当你离散数字数组类,分类排列失去对实际数值的所有信息。在这个例子中,AGECAT不是数字,你不能从它恢复原始数据值。

归类数字数组成四分位数。

变量重量有重量样本的测量值的患者。分类的患者体重分为四类,由四分位数。

P = 0:0.25:1;符=位数(hospital.Weight,P);hospital.WeightQ =序(hospital.Weight,{'Q1''Q2''Q3''Q4'},...[],时间);getlevels(hospital.WeightQ)
ANS =1×4序Q1,Q2,Q3,Q4

探索类别。

显示第二个病人的重量和重量的四分位数。

数据集({hospital.Weight(2),'重量'},...{hospital.WeightQ(2),'WeightQuartile'})
ANS =重量WeightQuartile 163 Q3

按类别划分等级汇总统计。

计算每个年龄和体重类别的平均收缩压和舒张压。

grpstats(医院,{'AGECAT'“重量Q”},'意思''DataVars''血压'
ANS = AGECAT重量Q GroupCount mean_BloodPressure在30_Q1在30 Q1 6 123.17 79.667在30_Q2在30 Q2 3 120.33 79.667在30_Q3在30 Q3 2 127.5 86.5在30_Q4在30 Q4 4 122 78 30-39_Q1 30-39 Q1 12 121.75 81.75 30-39_Q2 30-39 Q2 9 119.56 82.556 30-39_Q3 30-39 Q3 9 121 83.222 30-39_Q4 30-39 Q4 11 125.55 87.273超过40_Q1超过四Q1 7 122.14 84.714超过40_Q2超过四Q2 13 123.38 79.385超过40_Q3超过40 14 Q3123.07 84.643在40_Q4超过40 Q4 10 124.6 85.1

变量血压是具有两列的矩阵。第一列是收缩压,和第2栏是舒张压。最高平均舒张压样品中的组,87.273,是30-39,并在最高的四分位数的重量岁,30-39_Q4

也可以看看

|

相关的例子

更多关于