主要内容

Limpiar数据的混淆和数据的ausentes用MATLAB

Este ejemplo muestra cómo encontrar, limpiar y eliminar filas de tabla con datos ausentes。

Cargar datos de muestra

在昏迷中分离的文献资料messy.csv.连续多份数据索引档案:

  • caracteres矢量vacío (")

  • Punto(。)

  • NA

  • -99年

特定的英勇矢量vacíos,使用英勇之名的论证“TreatAsMissing”Con la funciónreadtable.(使用funcióndispPara most strar las 21 filas,包括cuando ejecute ejemplo como UN script in vivo)。

T =可读的(“messy.csv”“TreatAsMissing”, {“。”“NA”});disp (T)
A B C D E  ________ ____ __________ ____ ____ {' afe1 '}{'是的'}3 3{‘egh3}南{‘不’}7 7{‘wth4}{'是的'}3 3{‘atn2} 23{‘不’}23日23{‘__arg1}{'是的'}5 5{‘jre3} 34.6{'是的'}34.6 - 34.6{‘wen9} 234{'是的'}234 234{‘ple2}{‘不’}2 2{‘dbo8}{‘不’}5 5{‘oii4}{'是的'}5 245{‘wnk3}{'是的'}245 245{‘abk6} 563 {0 x0 char} 563 563{‘pnj5} 463{‘不’}463 463{‘wnn3}{‘不’}6 6{‘oks9} 23{'是的'}23日23{‘wba3}南{'是的'}南14{‘pkn4}{‘不’}2 2{' adw3} 22{‘不’}22 22{‘poj2} -99{'是的'}-99 -99{‘bas8} 23{‘不’}23日23{‘gry5}南{'是的'}南21

TEs una tabla con 21 filas y cinco变量。“TreatAsMissing”我在这一栏上独唱numéricas我在这一栏上独唱numéricos我在这一栏上独唱“-99”

恢复手鼓

查阅资料,la descripción, las unidades y otras estadísticas description para cada变量creando un resumen de la tabla mediante la función总结

总结(T)
变量:A: 21x1 cell array of character vector B: 21x1 double值:Min -99 Median 14 Max 563 NumMissing 3 C: 21x1 cell array of character vector D: 21x1 double值:Min -99 Median 7 Max 563 NumMissing 2 E: 21x1 double值:Min -99 Median 14 Max 563

这是重要的档案资料,la opción我有自己的一段readtable变量元素不numéricos como UN arreglo de celdas de caracteres。

恩宠之于价

手鼓之声下的音乐T我知道联合国是勇敢的。

TF = ismissing(T,{“。”“NA”南-99});rowsWithMissing = T(任意(TF,2),:);disp (rowsWithMissing)
A B C D E  ________ ___ __________ ___ ___ {' egh3}南{‘不’}7 563{“abk6”}{0 x0 char} 563 563{‘wba3}南{'是的'}南-99{‘poj2}{'是的'}-99 -99{‘gry5}南{'是的'}南21

readtablereemplazo“。”y“NA”反对En las变量numéricasBDyE

重新定位价值指标

在非洲大陆的数据和指示的价值之间código-99年腾干el指数de valor numérico ausente estándar de MATLAB®

T =标准化发射(T,-99);disp (T)
A B C D E  ________ ____ __________ ____ ____ {' afe1 '}{'是的'}3 3{‘egh3}南{‘不’}7 7{‘wth4}{'是的'}3 3{‘atn2} 23{‘不’}23日23{‘__arg1}{'是的'}5 5{‘jre3} 34.6{'是的'}34.6 - 34.6{‘wen9} 234{'是的'}234 234{‘ple2}{‘不’}2 2{‘dbo8}{‘不’}5 5{‘oii4}{'是的'}5 245{‘wnk3}{'是的'}245 245{‘abk6} 563 {0 x0 char} 563 563{‘pnj5} 463{‘不’}463 463{‘wnn3}{‘不’}6 6{‘oks9} 23{'是的'}23日23{‘wba3}南{'是的'}南14{‘pkn4}{‘不’}2 2{'adw3'} 22 {'no'} 22 22 {'poj2'} NaN {'yes'} NaN NaN {'bas8'} 23 {'no'} 23 23 {'gry5'} NaN {'yes'} NaN 21

standardizeMissing生命的瞬间-99年反对

Cree una tabla nueva,T2“重新安置手鼓的价值,奥森特的价值和手鼓前的价值。”fillmissing比例变化的完整形式和价值。

T2 =填充缺失(T,“以前”);disp (T2)
A B C D E  ________ ____ _______ ____ ____ {' afe1 '}{'是的'}3 3{‘egh3} 3{‘不’}7 7{‘wth4}{'是的'}3 3{‘atn2} 23{‘不’}23日23{‘__arg1}{'是的'}5 5{‘jre3} 34.6{'是的'}34.6 - 34.6{‘wen9} 234{'是的'}234 234{‘ple2}{‘不’}2 2{‘dbo8}{‘不’}5 5{‘oii4}{'是的'}5 245{‘wnk3}{'是的'}245 245{‘abk6} 563{'是的'}563 563{‘pnj5} 463{‘不’}463 463{‘wnn3}{‘不’}6 6{‘oks9} 23{'是的'}23日23{‘wba3} 23{'是的'}23 14{‘pkn4}{‘不’}2 2{‘adw3} 22{‘不’}22 22{'poj2'} 22 {'yes'} 22 22 {'bas8'} 23 {'no' } 23 23 {'gry5'} 23 {'yes'} 23 21

消灭所有的生命

Cree una tabla nueva,T3,我一个人去看电影TSin valores ausentes。T3Tiene solo 16 filas。

T3 = rmmissing(T);disp (T3)
A B C D E  ________ ____ _______ ____ ____ {' afe1 '}{'是的'}3 3{‘wth4}{'是的'}3 3{‘atn2} 23{‘不’}23日23{‘__arg1}{'是的'}5 5{‘jre3} 34.6{'是的'}34.6 - 34.6{‘wen9} 234{'是的'}234 234{‘ple2}{‘不’}2 2{‘dbo8}{‘不’}5 5{‘oii4}{'是的'}5 245{‘wnk3}{'是的'}245 245{‘pnj5} 463{‘不’}463 463{‘wnn3}{‘不’}6 6{‘oks9} 23{'是的'}23日23{‘pkn4}{‘不’}2 2{‘adw3} 22{‘不’}22 22{‘bas8} 23{‘不’}23日23

T3连续16个变量。

Organizar拿督

Ordene las filas deT3En orden descent porCY, a continuación, ordénelas por orden ascendente por一个

T3 = sortrows(T2,{“C”“一个”}, {“下”“提升”});disp (T3)
A B C D E  ________ ____ _______ ____ ____ {' abk6} 563{'是的'}563 563{‘afe1}{'是的'}3 3{‘__arg1}{'是的'}5 5{‘gry5} 23{'是的'}23 21 34.6{‘jre3}{'是的'}34.6 - 34.6{‘oii4}{'是的'}5 5{‘oks9} 23{'是的'}23日23{‘poj2} 22{'是的'}22 22{‘wba3} 23{'是的'}23 234{‘wen9}{'是的'}234 234{‘wnk3} 245{'是的'}245 245{‘wth4}{'是的'}3 3{‘adw3} 22{‘不’}22 22{‘atn2} 23{‘不’}23日23{‘bas8} 23{‘不’}23日23日{‘dbo8}{‘不’}5 5{‘egh3} 3{‘不’}7 7{‘pkn4} 2{‘不’}2 2{‘ple2}{‘不’}2 463{‘pnj5}{‘不’}463 463{‘wnn3}{‘不’}6 6

C,这是最原始的“是的”, seguidas de“不”.在一个, las filas se ordenan alfabéticamente。

重唱手鼓一个yC当时esten团体。

T3 = T3(:,{“一个”“C”“B”' D '“E”});disp (T3)
一个C B D E  ________ _______ ____ ____ ____ {' abk6’}{'是的'}563 563 563{‘afe1}{'是的'}3 3 3{‘__arg1}{'是的'}5 5 5{‘gry5}{'是的'}23日23日21{‘jre3}{'是的'}34.6 34.6 34.6{‘oii4}{'是的'}5 5 5{‘oks9}{'是的'}23 23日23{‘poj2}{'是的'}22 22 22{‘wba3}{'是的'}23日23日14{‘wen9}{'是的'}234 234 234{‘wnk3}{'是的'}245 245 245{‘wth4}{'是的'}3 3 3{‘adw3}{‘不’}22 22 22{‘atn2}{‘不’}23 23日23{‘bas8}{‘不’}23 23日23{‘dbo8}{‘不’}5 5 5{‘egh3}{‘不’}3 7 7{‘pkn4}{‘不’}22 2{‘ple2}{‘不’}2 2 2{‘pnj5}{‘不’}463 463 463{‘wnn3}{‘不’}6 6 6

Consulte也

||||||

特马relacionados