matlab.io.datastore.DsFileSet类

包:matlab.io.datastore

在数据存储文件的收集文件集对象

描述

DsFileSet对象可以帮助您管理的文件的大集合的迭代处理。使用DsFileSet与对象一起DsFileReader对象来管理,并从数据存储读取文件。

施工

FS= matlab.io.datastore.DsFileSet(位置回报DsFileSet对象基础上指定的文件的集合位置

FS= matlab.io.datastore.DsFileSet(位置名称,值指定附加参数DsFileSet对象使用一个或多个名称 - 值对的参数。名称也可以是属性名称,是对应的值。名称必须出现内单引号(“”)。您可以按照任何顺序指定多个名称 - 值对参数名1,值1,...,NameN,值N

输入参数

展开全部

文件或文件夹包括在文件集对象,指定为字符向量,特征向量,字符串或一个结构的单元阵列。如果文件不在当前文件夹中,然后位置必须是完整或相对路径。的子文件夹中的文件指定的文件夹不会自动包含在文件中设定的目标。

通常,对于一个Hadoop®工作流程,当您指定位置作为一个结构,它必须包含的字段文档名称抵消尺寸。这一要求使您可以使用位置与直接论证initializeDatastore的方法matlab.io.datastore.HadoopLocationBased类。对于一个示例,请参见添加支持万博1manbetx的Hadoop

指定时,可以使用通配符(*)位置。指定这个人物包括在文件中设定的目标匹配的文件夹中所有匹配的文件或所有文件。

如果文件不是本地可用,则该文件或文件夹的完整路径必须是统一资源定位符(URL),如
HDFS://主机名端口号/文件路径

数据类型:烧焦|细胞||结构

名称 - 值对参数

指定可选的用逗号分隔的对名称,值参数。名称是参数的名称和是对应的值。名称必须出现引号内。您可以按照任何顺序指定多个名称和值对参数名1,值1,...,NameN,值N

例:'FileExtensions',{ 'JPG', 'TIF'}包括与所有文件.JPG要么.TIF扩展的文件集目的。

文件扩展名,指定为逗号分隔的一对组成的'FileExtensions'和字符向量,特征向量,或串的单元阵列。您可以使用空引号“”代表文件,而不扩展。

如果'FileExtensions'未指定,则DsFileSet自动包含所有文件扩展名。

例:'FileExtensions', 'JPG'

例:'FileExtensions',{ 'TXT', 'CSV'}

数据类型:烧焦|细胞|

子文件夹包含标志,指定为逗号分隔的一对组成的'IncludeSubfolders'真正要么。指定真正包括每个文件夹中的所有文件和子文件夹或只包括每个文件夹中的文件。

例:'IncludeSubfolders',真

数据类型:合乎逻辑|

备用文件系统的根路径,指定为逗号分隔的一对组成的'AlternateFileSystemRoots'和一个字符串载体或细胞阵列。用'AlternateFileSystemRoots'当您创建一个本地计算机上的数据存储,但需要访问和处理另一台机器上的数据(可能是不同的操作系统)。此外,使用并行计算工具箱处理数据时™和MATLAB®并行服务器™,并且将数据存储在本地机器上不同平台的云或集群机器的可用数据的副本,你必须使用'AlternateFileSystemRoots'到根的路径相关联。

  • 到一组的根路径等效于彼此关联,指定'AlternateFileSystemRoots'作为一个字符串矢量。例如,

    [ “Z:\数据集”, “/的MyNetwork /数据集”]

  • 多组的根的路径是等效的数据存储区相关联,指定'AlternateFileSystemRoots'作为含有其中每一行表示一组等效根路径多行的单元阵列。指定单元阵列作为一个字符串矢量或字符向量的单元阵列中的每一行。例如:

    • 指定'AlternateFileSystemRoots'作为串矢量的单元阵列。

      {[ “Z:\数据集”, “/的MyNetwork /数据集”]; ... [ “Y:\数据集”, “/ mynetwork2 /数据集”, “S:\数据集”]}

    • 或者,指定'AlternateFileSystemRoots'作为字符向量的单元阵列的单元阵列。

      {{ 'Z:\数据集',“/的MyNetwork /数据集的}; ... { 'Y:\数据集', '/ mynetwork2 /数据集', 'S:\数据集'}}

的价值'AlternateFileSystemRoots'必须满足以下条件:

  • 包含一个或更多的行,其中每一行指定了一组等效根路径。

  • 每一行指定多个根路径和每根路径必须包含至少两个字符。

  • 根路径是独一无二的,没有彼此的子文件夹。

  • 包含至少一个根路径入口指向文件的位置。

欲了解更多信息,请参阅建立数据存储的处理在不同的机器或集群

例:[ “Z:\数据集”, “/的MyNetwork /数据集”]

数据类型:|细胞

属性

展开全部

此属性是只读的。

在文件设定的目标文件,指定为数字标数。

例:fs.NumFiles

数据类型:

此属性是只读的。

分割尺寸,指定为'文件'或数字标。

分配给该值FileSplitSize指示从输出下一文件方法。

  • 如果FileSplitSize'文件',那么下一文件方法返回与表文档名称文件大小抵消SplitSize。的价值SplitSize被设定为等于文件大小

  • 如果FileSplitSize是一个数字标ñ,那么下一文件方法返回文档名称文件大小抵消SplitSize。的价值SplitSize被设定为等于FileSplitSize。该信息被用来阅读ñ字节的文件。后续调用下一文件方法的返回信息,以帮助阅读下ñ字节相同的文件,直到文件的末尾。

例:'FileSplitSize',20

数据类型:|烧焦

方法

hasfile 确定是否多个文件的文件集对象可用
maxpartitions 分区的最大数量
下一文件 对下一个文件或文件块信息
划分 分区文件集对象
子集 创建数据存储或文件集的子集
重启 重置文件集对象
解决 在文件中设定的目标的所有文件资料

例子

全部收缩

创建文件集对象,获取文件信息的一个文件时,或者在文件集对象中的所有文件获取信息。

所有创建文件集对象。垫从文件演示夹。

夹=完整文件(matlabroot,'工具箱''MATLAB'“演示”);FS = matlab.io.datastore.DsFileSet(文件夹,...'IncludeSubfolders',真正,...'FileExtensions''。垫');

获得用于从文件组对象中的第一和第二文件的信息。

fTable1 =下一文件(FS);%第一个文件fTable2 =下一文件(FS);第二%文件

通过获得信息,一次在一个文件中获取上的所有文件信息,收集信息到表。

英尺=细胞(fs.NumFiles,1);使用细胞效率%I = 1;复位(FS);%重置文件集的开始hasfile(FS)英尺{I} =下一文件(FS);I = I + 1;结束allFiles = vertcat(英尺{:});

另外,获得在同一时间上的所有文件信息。

allfiles =解析(FS);

提示

  • 如果使用DsFileSet对象作为您的自定义数据存储中的属性,然后实现copyElement方法。实施copyElement方法使您可以创建数据存储对象的深层副本。欲了解更多信息,请参阅自定义复印操作。举一个例子实施copyElement方法见开发自定义数据存储

介绍了在R2017b