请注意
的数据集
不推荐使用数据类型。要处理异构数据,请使用MATLAB®表格
数据类型。看到MATLAB表格
文档以获取更多信息。
有许多方法可以在数据集数组中建立索引。例如,对于数据集数组,ds
,您可以:
使用()
的子集创建新的数据集数组ds
.例如,ds1 = ds (1:5,:)
创建一个新的数据集数组,ds1的
的前五行ds
.元数据,包括变量和观察名称,转移到新的数据集数组。
使用点表示法的变量名来索引数据集数组中的单个变量。例如,ds。高度
将命名为高度
.
使用观察名称来索引数据集数组中的单个观察。例如,ds (Obs1,:)
给出名为Obs1
.
使用观察或可变数字。例如,ds(:,(1、3、5))
的第一个、第三个和第五个变量(列)中的数据ds
.
使用逻辑索引来搜索ds
满足一个逻辑条件。例如,ds (ds.Gender = =‘男性’,:)
给出了ds
其中变量名为性别
的标称数组,具有该值男性
.
使用ismissing
查找数据集数组中丢失的数据。
这个例子展示了分类数组的几个索引和搜索方法。
加载示例数据。
负载医院;大小(医院)
ans =1×2100年7
数据集数组有100个观察值和7个变量。
根据名称为变量建立索引。返回数据集数组中的最小年龄。
分钟(hospital.Age)
ans = 25
删除变量试用
.
医院。试用= []; size(hospital)
ans =1×2100年6
根据名称为观察建立索引。显示所命名观测的前五个变量的测量值pue - 347
.
医院(“pue - 347”1:5)
ans =姓氏性别年龄体重吸烟者PUE-347 {'YOUNG'}女性25 114 false
通过数字索引变量。创建一个包含的前四个变量的新数据集数组医院
.
dsNew =医院(:,1:4);dsNew.Properties.VarNames (:)
ans =4 x1细胞{'LastName'} {'Sex'} {'Age'} {'Weight'}
通过数字索引观察结果。删除最后10个观察结果。
医院(end-9:最终,)= [];大小(医院)
ans =1×290年6
根据逻辑条件搜索观察结果。创建一个新的数据集数组,只包含吸烟的女性。
dsf =医院(医院。性= =“女”& hospital.Smoker = = true:);dsf (: {“姓”,“性”,“抽烟”})
ans = LastName性吸烟者lpd - 746{米勒的}女性真正xbr - 291{“加西亚”}女性真正aax - 056{‘李’}女性真正的德勤- 578{沃克的}女性真正afk - 336{“莱特”}女性真正的澳大利亚央行- 579{桑切斯的}女性真正hak) - 381{“莫里斯”}女性真正的精工- 403{拉米雷斯的}女性真正的ils - 109{‘沃森’}女性真正jdr - 456{桑德斯的}女性真实的HWZ-321 {'PATTERSON'} Female true guu -691 {'HUGHES'} Female true WUS-105 {'FLORES'} Female true