这个例子展示了如何在数据集数组中添加和删除变量。您还可以使用Variables编辑器编辑数据集数组。
从第一个工作表导入数据hospitalSmall.xlsx
进入数据集数组。
ds =数据集(“XLSFile”fullfile (matlabroot“帮助/工具箱/统计/例子”,“hospitalSmall.xlsx”));大小(ds)
Ans = 14 6
数据数组,ds
,有14个观察值(行)和6个变量(列)。
工作表高度
在hospitalSmall.xlsx
在第一张工作表上有病人的身高。将此电子表格中的数据连接到ds
。
ds2 =数据集(“XLSFile”fullfile (matlabroot“帮助/工具箱/统计/例子”,“hospitalSmall.xlsx”),“表”,“高度”);Ds = [ds2];大小(ds)
Ans = 14 7
数据集数组现在有7个变量。您只能水平地将数据集数组与位于相同位置的观测数据或具有相同观测名称的观测数据连接起来。
ds.Properties.VarNames{结束}
ans =高度
中最后一个变量的名称ds
是高度
,这数据集
从导入的电子表格的第一行读取。
首先,在变量中指定唯一标识符id
作为观察的名字。然后,删除变量id
从数据集数组。
ds.Properties.ObsNames = ds.id;ds。id= []; size(ds)
Ans = 14 6
数据集数组现在有6个变量。列出变量名。
ds.Properties.VarNames (:)
Ans = 'name' '性别' '年龄' 'wgt' '吸烟' 'hgt' '
不再有一个变量被调用id
。
添加一个新变量,身体质量指数
-其中包含数据集数组中每个患者的体重指数(BMI)。BMI是身高和体重的函数。显示每位患者的姓氏、性别和BMI。
ds。身体质量指数= ds.wgt*703./ds.hgt.^2; ds(:,{“姓名”,“性”,“身体质量指数”})
ans =名字性bmi ypl - 320“史密斯”“m”24.544 gli - 532“约翰逊”“m”24.068句- 258”威廉姆斯mij 23.958 f - 579“琼斯”xlk 25.127 f - 030“棕色”f 21.078 tfp - 518“戴维斯”f 27.729 lpd - 746“米勒”f 26.828 ata - 945“威尔逊”“m”24.41 vnl - 702“摩尔”“m”27.822 lqw - 768“泰勒”qfy 22.655 f - 472“安德森”ujg 23.409 f - 627“托马斯”“f”24.883 TRW-072 'WHITE' 'm' 29.827
运营商./
和^。
在计算BMI时,分别表示按元素进行除法和取指数。
删除变量重量
,数据集数组中的第四个变量。
ds (:, 4) = [];ds.Properties.VarNames (:)
Ans = 'name' '性别' '年龄' '吸烟' 'hgt' 'bmi'
的变量重量
从数据集数组中删除。