Limpiar数据的混淆和数据的ausentes用MATLAB
Este ejemplo muestra cómo encontrar, limpiar y eliminar filas de tabla con datos ausentes。
Cargar datos de muestra
在昏迷中分离的文献资料messy.csv
.连续多份数据索引档案:
caracteres矢量vacío (")
Punto(。)
NA
南
-99年
特定的英勇矢量vacíos,使用英勇之名的论证“TreatAsMissing”
Con la funciónreadtable
.(使用funcióndisp
Para most strar las 21 filas,包括cuando ejecute ejemplo como UN script in vivo)。
T =可读的(“messy.csv”,“TreatAsMissing”, {“。”,“NA”});disp (T)
A B C D E ________ ____ __________ ____ ____ {' afe1 '}{'是的'}3 3{‘egh3}南{‘不’}7 7{‘wth4}{'是的'}3 3{‘atn2} 23{‘不’}23日23{‘__arg1}{'是的'}5 5{‘jre3} 34.6{'是的'}34.6 - 34.6{‘wen9} 234{'是的'}234 234{‘ple2}{‘不’}2 2{‘dbo8}{‘不’}5 5{‘oii4}{'是的'}5 245{‘wnk3}{'是的'}245 245{‘abk6} 563 {0 x0 char} 563 563{‘pnj5} 463{‘不’}463 463{‘wnn3}{‘不’}6 6{‘oks9} 23{'是的'}23日23{‘wba3}南{'是的'}南14{‘pkn4}{‘不’}2 2{' adw3} 22{‘不’}22 22{‘poj2} -99{'是的'}-99 -99{‘bas8} 23{‘不’}23日23{‘gry5}南{'是的'}南21
T
Es una tabla con 21 filas y cinco变量。“TreatAsMissing”
我在这一栏上独唱numéricas我在这一栏上独唱numéricos我在这一栏上独唱“-99”
.
恢复手鼓
查阅资料,la descripción, las unidades y otras estadísticas description para cada变量creando un resumen de la tabla mediante la función总结
.
总结(T)
变量:A: 21x1 cell array of character vector B: 21x1 double值:Min -99 Median 14 Max 563 NumMissing 3 C: 21x1 cell array of character vector D: 21x1 double值:Min -99 Median 7 Max 563 NumMissing 2 E: 21x1 double值:Min -99 Median 14 Max 563
这是重要的档案资料,la opción我有自己的一段readtable
变量元素不numéricos como UN arreglo de celdas de caracteres。
恩宠之于价
手鼓之声下的音乐T
我知道联合国是勇敢的。
TF = ismissing(T,{”“。”“NA”南-99});rowsWithMissing = T(任意(TF,2),:);disp (rowsWithMissing)
A B C D E ________ ___ __________ ___ ___ {' egh3}南{‘不’}7 563{“abk6”}{0 x0 char} 563 563{‘wba3}南{'是的'}南-99{‘poj2}{'是的'}-99 -99{‘gry5}南{'是的'}南21
readtable
reemplazo“。”
y“NA”
反对南
En las变量numéricasB
,D
yE
.
重新定位价值指标
在非洲大陆的数据和指示的价值之间código-99年
腾干el指数de valor numérico ausente estándar de MATLAB®南
.
T =标准化发射(T,-99);disp (T)
A B C D E ________ ____ __________ ____ ____ {' afe1 '}{'是的'}3 3{‘egh3}南{‘不’}7 7{‘wth4}{'是的'}3 3{‘atn2} 23{‘不’}23日23{‘__arg1}{'是的'}5 5{‘jre3} 34.6{'是的'}34.6 - 34.6{‘wen9} 234{'是的'}234 234{‘ple2}{‘不’}2 2{‘dbo8}{‘不’}5 5{‘oii4}{'是的'}5 245{‘wnk3}{'是的'}245 245{‘abk6} 563 {0 x0 char} 563 563{‘pnj5} 463{‘不’}463 463{‘wnn3}{‘不’}6 6{‘oks9} 23{'是的'}23日23{‘wba3}南{'是的'}南14{‘pkn4}{‘不’}2 2{'adw3'} 22 {'no'} 22 22 {'poj2'} NaN {'yes'} NaN NaN {'bas8'} 23 {'no'} 23 23 {'gry5'} NaN {'yes'} NaN 21
standardizeMissing
生命的瞬间-99年
反对南
.
Cree una tabla nueva,T2
“重新安置手鼓的价值,奥森特的价值和手鼓前的价值。”fillmissing
比例变化的完整形式和价值。
T2 =填充缺失(T,“以前”);disp (T2)
A B C D E ________ ____ _______ ____ ____ {' afe1 '}{'是的'}3 3{‘egh3} 3{‘不’}7 7{‘wth4}{'是的'}3 3{‘atn2} 23{‘不’}23日23{‘__arg1}{'是的'}5 5{‘jre3} 34.6{'是的'}34.6 - 34.6{‘wen9} 234{'是的'}234 234{‘ple2}{‘不’}2 2{‘dbo8}{‘不’}5 5{‘oii4}{'是的'}5 245{‘wnk3}{'是的'}245 245{‘abk6} 563{'是的'}563 563{‘pnj5} 463{‘不’}463 463{‘wnn3}{‘不’}6 6{‘oks9} 23{'是的'}23日23{‘wba3} 23{'是的'}23 14{‘pkn4}{‘不’}2 2{‘adw3} 22{‘不’}22 22{'poj2'} 22 {'yes'} 22 22 {'bas8'} 23 {'no' } 23 23 {'gry5'} 23 {'yes'} 23 21
消灭所有的生命
Cree una tabla nueva,T3
,我一个人去看电影T
Sin valores ausentes。T3
Tiene solo 16 filas。
T3 = rmmissing(T);disp (T3)
A B C D E ________ ____ _______ ____ ____ {' afe1 '}{'是的'}3 3{‘wth4}{'是的'}3 3{‘atn2} 23{‘不’}23日23{‘__arg1}{'是的'}5 5{‘jre3} 34.6{'是的'}34.6 - 34.6{‘wen9} 234{'是的'}234 234{‘ple2}{‘不’}2 2{‘dbo8}{‘不’}5 5{‘oii4}{'是的'}5 245{‘wnk3}{'是的'}245 245{‘pnj5} 463{‘不’}463 463{‘wnn3}{‘不’}6 6{‘oks9} 23{'是的'}23日23{‘pkn4}{‘不’}2 2{‘adw3} 22{‘不’}22 22{‘bas8} 23{‘不’}23日23
T3
连续16个变量。
Organizar拿督
Ordene las filas deT3
En orden descent porC
Y, a continuación, ordénelas por orden ascendente por一个
.
T3 = sortrows(T2,{“C”,“一个”}, {“下”,“提升”});disp (T3)
A B C D E ________ ____ _______ ____ ____ {' abk6} 563{'是的'}563 563{‘afe1}{'是的'}3 3{‘__arg1}{'是的'}5 5{‘gry5} 23{'是的'}23 21 34.6{‘jre3}{'是的'}34.6 - 34.6{‘oii4}{'是的'}5 5{‘oks9} 23{'是的'}23日23{‘poj2} 22{'是的'}22 22{‘wba3} 23{'是的'}23 234{‘wen9}{'是的'}234 234{‘wnk3} 245{'是的'}245 245{‘wth4}{'是的'}3 3{‘adw3} 22{‘不’}22 22{‘atn2} 23{‘不’}23日23{‘bas8} 23{‘不’}23日23日{‘dbo8}{‘不’}5 5{‘egh3} 3{‘不’}7 7{‘pkn4} 2{‘不’}2 2{‘ple2}{‘不’}2 463{‘pnj5}{‘不’}463 463{‘wnn3}{‘不’}6 6
在C
,这是最原始的“是的”
, seguidas de“不”
.在一个
, las filas se ordenan alfabéticamente。
重唱手鼓一个
yC
当时esten团体。
T3 = T3(:,{“一个”,“C”,“B”,' D ',“E”});disp (T3)
一个C B D E ________ _______ ____ ____ ____ {' abk6’}{'是的'}563 563 563{‘afe1}{'是的'}3 3 3{‘__arg1}{'是的'}5 5 5{‘gry5}{'是的'}23日23日21{‘jre3}{'是的'}34.6 34.6 34.6{‘oii4}{'是的'}5 5 5{‘oks9}{'是的'}23 23日23{‘poj2}{'是的'}22 22 22{‘wba3}{'是的'}23日23日14{‘wen9}{'是的'}234 234 234{‘wnk3}{'是的'}245 245 245{‘wth4}{'是的'}3 3 3{‘adw3}{‘不’}22 22 22{‘atn2}{‘不’}23 23日23{‘bas8}{‘不’}23 23日23{‘dbo8}{‘不’}5 5 5{‘egh3}{‘不’}3 7 7{‘pkn4}{‘不’}22 2{‘ple2}{‘不’}2 2 2{‘pnj5}{‘不’}463 463 463{‘wnn3}{‘不’}6 6 6
Consulte也
readtable
|总结
|ismissing
|sortrows
|standardizeMissing
|rmmissing
|fillmissing