该公称
和序数词
不推荐组数据类型。代表有序和无序的离散,非数值数据,使用分类数组(MATLAB)数据类型来代替。
这个例子展示了如何使用数字数据归类到一个分类顺序排列序数词
。这是离散的连续数据是有用的。
加载样本数据。
数据集阵列,医院
包含对患者的样品进行测定的变量。计算最小值,中值和变量的最大年龄
。
加载医院分位数(hospital.Age,[0,.5,1])
ANS =1×325 39 50
患者年龄范围从25到50。
转换一个数字阵列的序阵列。
组患者分为年龄种类在30
,30-39
,在40
。
hospital.AgeCat =序(hospital.Age,{“在30”,'30 -39',“在40”},...[],[25,30,40,50]);getlevels(hospital.AgeCat)
ANS =1×3的序在30 30-39 40以上
最后输入的参数序数词
有类别的端点。第一类开始于25岁,该第二30岁,等等。最后一类包含40岁及以上,所以在40和端部开始于50(最大年龄在数据集中)。要指定三大类,你必须指定四个端点(最后的终点是上界的最后一类的)。
探索类别。
显示年龄和年龄段关于第二患者。
数据集({hospital.Age(2),'年龄'},...{hospital.AgeCat(2),'AgeCategory'})
ANS =年龄AgeCategory 43超过四
当你离散数字数组类,分类排列失去对实际数值的所有信息。在这个例子中,AGECAT
不是数字,你不能从它恢复原始数据值。
归类数字数组成四分位数。
变量重量
有重量样本的测量值的患者。分类的患者体重分为四类,由四分位数。
P = 0:0.25:1;符=位数(hospital.Weight,P);hospital.WeightQ =序(hospital.Weight,{'Q1','Q2','Q3','Q4'},...[],时间);getlevels(hospital.WeightQ)
ANS =1×4序Q1,Q2,Q3,Q4
探索类别。
显示第二个病人的重量和重量的四分位数。
数据集({hospital.Weight(2),'重量'},...{hospital.WeightQ(2),'WeightQuartile'})
ANS =重量WeightQuartile 163 Q3
按类别划分等级汇总统计。
计算每个年龄和体重类别的平均收缩压和舒张压。
grpstats(医院,{'AGECAT',“重量Q”},'意思','DataVars','血压')
ANS = AGECAT重量Q GroupCount mean_BloodPressure在30_Q1在30 Q1 6 123.17 79.667在30_Q2在30 Q2 3 120.33 79.667在30_Q3在30 Q3 2 127.5 86.5在30_Q4在30 Q4 4 122 78 30-39_Q1 30-39 Q1 12 121.75 81.75 30-39_Q2 30-39 Q2 9 119.56 82.556 30-39_Q3 30-39 Q3 9 121 83.222 30-39_Q4 30-39 Q4 11 125.55 87.273超过40_Q1超过四Q1 7 122.14 84.714超过40_Q2超过四Q2 13 123.38 79.385超过40_Q3超过40 14 Q3123.07 84.643在40_Q4超过40 Q4 10 124.6 85.1
变量血压
是具有两列的矩阵。第一列是收缩压,和第2栏是舒张压。最高平均舒张压样品中的组,87.273
,是30-39,并在最高的四分位数的重量岁,30-39_Q4
。