如何提取行数据根据细胞包含特定单词的文本在Matlab

73(30天)

显示旧的评论

索菲娅 2023年5月27日16:31

0
链接

这个问题直接联系

//www.tianjin-qmedu.com/matlabcentral/answers/1974534-how-to-extract-rows-of-data-according-to-text-containing-specific-words-in-cells-in-matlab

评论道: 索菲娅2023年5月31日14:14

答:接受马特·J

你好,

我很坚持一个问题,我想从大Excel文件中提取某些变量分类生物从多个年Excel在MATLAB所以我可以处理它。我想提取所有列从L和数据的行号我需要从657828:1048576。我试过过滤函数在excel中,但它不工作所以我在MATLAB。我多么想过滤器,它包括列j叫什么 object_annotation_hierachy 和精确的物种我想过滤掉以下:

Arthropoda_Crustacea_Maxillopoda_Copepoda_Calanoida_Calanidae

Arthropoda_Crustacea_Maxillopoda_Copepoda_Calanoida_Metridinidae

Arthropoda_Crustacea_Maxillopoda_Copepoda_Calanoida_Candaciidae

Arthropoda_Crustacea_Maxillopoda_Copepoda_Calanoida_Heterorhabdidae

Arthropoda_Crustacea_Maxillopoda_Copepoda_Calanoida_Euchaetidae

Arthropoda_Crustacea_Maxillopoda_Copepoda_Calanoida_Metridinidae

Arthropoda_Crustacea_Maxillopoda_Copepoda_Cyclopoida_Oithonidae

Arthropoda_Crustacea_Maxillopoda_Copepoda_Calanoida_Acartiidae

Arthropoda_Crustacea_Maxillopoda_Copepoda_Calanoida_Temoridae

所有其他物种的变化但我想包括所有数据与桡足类的标题中。

我想进一步提取到的第一列的名称,叫object_id (“cruise2012”) 2016。

到目前为止是这样的代码,但是它不工作:

                          C = csvread (“cruise_2004_2016_ZooScan_dataset.csv”);
                         
                          % R657828, C1048576(就在第一行代码用来显示位置)
                         
                          桡足类包含(C.object_id = = =“cruise2012”)& (C.object_annotation_hierachy“桡足类”);
                         
                          C1 = C(桡足类:);

任何帮助将是感谢!

5个评论
显示4年长的评论隐藏4年长的评论

索菲娅 2023年5月30日在25

example_data.xlsx

我已经上传,将虚拟文字取代,它通常是一个更长时间。我也分裂和numerized表中的分类和代码中有一个更简单的方法去做。因为我有numerized第一和第十行我用这段代码,但似乎仍然不工作。

选择= detectImportOptions ( “Zoocam.xlsx” );

opts.VariableTypes (2) = { “双” };

opts.VariableTypes (19) = { “双” };

opts.VariableTypes (20) = { “双” };

C = readtable ( “Zoocam.xlsx” 、选择);

C.index = (C。对象= = 2017 & C.object_annotation_hierarchy < 18);

C_new = C (C.index = = 1, { “对象” , “object_lat” , “object_lon” , “object_annotation_hierarchy” , “object_area” });

writetable (C_new 2017 _data.csv );

登录置评。

在回答这个问题。

接受的答案

马特·J 2023年5月27日在十九31

0
链接

直接链接到这个答案

//www.tianjin-qmedu.com/matlabcentral/answers/1974534-how-to-extract-rows-of-data-according-to-text-containing-specific-words-in-cells-in-matlab answer_1245894

编辑:马特·J 2023年5月30日11:16

                              桡足类=包含(C.object_id,“cruise2012”)&…
                             
                              包含(C.object_annotation_hierarchy“桡足类”);

14日的评论
显示13年长的评论隐藏13年长的评论

沃尔特·罗伯森 2023年5月28日15

csvread()只能用于读取文件,有非数字文本如果文本在领先行根据R参数被忽略,或者主要列中的文本,根据C参数将被跳过。如果你有一个文本列那不是主要列(跳过)然后csvread 不能甚至通过指定一个RNG处理它。

csvread()过程调用dlmread与逗号分隔符(),和dlmread()过程是调用textscan()格式”(空白格式)并根据R, HeaderLines和无证选项指示多少列跳过。一切不是一个领导跳过行或领导跳过列必须是一个数字。dlmread()不适用RNG直到它读入右下方的数据——如果RNG指定您想要忽略后列包含文本,这将是太迟了,textscan()已经无法读取数据。

                                   C = csvread (“cruise_2004_2016_ZooScan_dataset.csv”);
                                  
                                   % R657828, C1048576(就在第一行代码用来显示位置)
                                  
                                   桡足类包含(C.object_id = = =“cruise2012”)& (C.object_annotation_hierachy“桡足类”);

csvread()总是返回数值数据, 从来没有一个结构或对象或表,您可以使用dot-indexing。csvread () 不每个指定列创建一个变量。csvread()无法处理列名, 除了由用户指定一个R抵消这足以跳过列名。

马特·J 2023年5月30日在十一17

编辑:马特·J 2023年5月30日11:19

small_data.xlsx

这似乎工作。

                                   文件名=“small_data.xlsx”;
                                  
                                   选择= detectImportOptions(文件名,“ExpectedNumVariables”13);
                                  
                                   opts.VariableTypes ([10]) = {“字符串”};
                                  
                                   C = readtable(文件名,选择);
                                  
                                      警告:列标题从文件被修改,使之有效MATLAB标识符表在创建变量名之前。最初的列标题保存在VariableDescriptions属性。
设置“VariableNamingRule”“保存”使用原始的列标题,表变量名。

                                   桡足类=包含(C.object_id,“cruise2012”)&…
                                  
                                   包含(C.object_annotation_hierarchy“桡足类”);
                                  
                                   :C_new = C(桡足类)
                                  
                                      C_new =5×13表
                                     
                                      object_id
                                      objid
                                      object_lat
                                      object_lon
                                      object_date
                                      object_time
                                      object_depth_min
                                      object_depth_max
                                      object_annotation_category
                                      object_annotation_hierarchy
                                      classif_id
                                      object__item
                                      object_area
                                      _______
                                      __________
                                      __________
                                      __________
                                      ___________
                                      ___________
                                      ___________
                                      ___________
                                      __________________________
                                      ________________________________________________________________________________________________________________
                                      __________
                                      _______
                                      ___________“cruise2012”4.1535 e + 08年47岁-4.3383 - 2.009 e + 07年16101 20 100.1{哲水蚤的}“活>真核生物> Opisthokonta > Holozoa >后生动物> >节肢动物甲壳纲动物> Maxillopoda >桡足类>哲水蚤> Euchaetidae”45074年23 1479年“cruise2012”4.1535 e + 08年47岁-4.3383 - 2.009 e + 07年16101 20 100.1{哲水蚤的}“活>真核生物> Opisthokonta > Holozoa >后生动物> >节肢动物甲壳纲动物> Maxillopoda >桡足类>哲水蚤> Metridinidae”45074年23 1479年“cruise2012”4.1535 e + 08年47岁-4.3383 - 2.009 e + 07年16101 20 100.1{哲水蚤的}“活>真核生物> Opisthokonta > Holozoa >后生动物> >节肢动物甲壳纲动物> Maxillopoda >桡足类>剑水蚤目> Oithonidae”45074年23 1479年“cruise2012”4.1535 e + 08年47岁-4.3383 - 2.009 e + 07年16101 20 100.1{哲水蚤的}“活>真核生物> Opisthokonta > Holozoa >后生动物> >节肢动物甲壳纲动物> Maxillopoda >桡足类>哲水蚤> Acartiidae”45074年23 1479年“cruise2012”4.1535 e + 08年47岁-4.3383 - 2.009 e + 07年16101 20 100.1{哲水蚤的}“活>真核生物> Opisthokonta > Holozoa >后生动物> >节肢动物甲壳纲动物> Maxillopoda >桡足类>哲水蚤> Temoridae”45074年23日1479年

索菲娅 2023年5月31日14:14

感谢马特:)

登录置评。

类别

MATLAB 数据导入与分析数据导入和导出标准文件格式电子表格

找到更多的在电子表格在帮助中心和文件交换

s manbetx 845

MATLAB

释放

R2022a

社区寻宝

找到宝藏在MATLAB中央,发现社区如何帮助你!

开始狩猎!

如何提取行数据根据细胞包含特定单词的文本在Matlab

5个评论
显示4年长的评论隐藏4年长的评论

接受的答案

14日的评论
显示13年长的评论隐藏13年长的评论

更多的答案(0)

另请参阅

类别

标签

s manbetx 845

释放

社区寻宝

如何提取行数据根据细胞包含特定单词的文本在Matlab

5个评论 显示4年长的评论隐藏4年长的评论

接受的答案

14日的评论 显示13年长的评论隐藏13年长的评论

更多的答案(0)

另请参阅

类别

标签

s manbetx 845

释放

社区寻宝

5个评论
显示4年长的评论隐藏4年长的评论

14日的评论
显示13年长的评论隐藏13年长的评论