データストアは,単一のファイルまたはファイルのストアは,同一个,同一のと形式をデータのリポジトリとしてししたとえば,データストア内各各ます同じ顺序现れる同じ型(数値またはテキストなど)のデータを含み,同じ区切り记号で区切られていなければなりません。
データストアは次の场合に役に立ちます。
。
コレクションに含まれるファイル任意任意名前が付いいるいるいる场はは,1つ以上のフォルダー含まれるのリポジトリとして机能し。
各データ型型アプリケーションの种类にづいのデータにには型のデータストアがサポートする型に连连するサポート含まに连连するプロパティがにに连するプロパティたとえばににデータするがプロパティたとえばにいデータデータに种类づいづい型作作するプロパティづい型型作作てづいづいづい作作就会含ま含ま型连连するたとえばたとえばていいいいてていいいてていいいたとえばづいづいづいづいててづいづいづいづいづいづいづいづいづいづいづいづいづいづいづいづいづいづいづいづいづいづいづいづいづいづいづいづいてづいはにづいのデータがはデータ型に连连连たとえばたとえばていいいいいいいいいいいいいいいいいいいいいいいいます®データストアの一は,次の表を参照してください。データデータストアの完全完全な覧,ファイル形式またはアプリケーションアプリケーションのデータストアのを参照してください。
ファイルファイルの种类またはデータ型 | データストアの种类 |
---|---|
CSVファイルファイルなどの列向向データデータを含むテキスト | TabularTextDatastore |
jpegやpngなど,imread によってサポートされる形式を含む,イメージファイル。 |
ImageageAtastore. |
.xlsx. などのサポートされているexcel®形式をもつスプレッドシートファイル。 |
SpreadsheetDatastore. |
mapreduce. の入力または出力であるキーと値のペアのデータ。 |
KeyValuedAtastore. |
列方向データを含む镶木地板。 | 帕奎特adaTastore. |
カスタムカスタム形式。 | filedatastore. |
高 配列のチェックポイントチェックストア。 |
塔塔塔雷斯 |
关节有关部tabularTextDatastore
を使用して,各航空会社のフライト出発到着到着情情がairlinesmall.csv
からからデータストア作作作作作作作者。结果はTabularTextDatastore
オブジェクトです。
ds = tabulartextdataStore('airlinesmall.csv'的)
ds = tabulartextdataStore with属性:文件:{'... \ matlab \ toolbox \ matlab \ demos \ airlinesmall.csv'}文件夹:{'... \ matlab \ toolbox \ matlab \ demos'} fileencoding:'UTF-8'lexeryfilesystroots:{} preservevariablenames:false readvariablenames:true variablenames:{'年','月','dayofmonth'...和26更多} datetimelocale:en_us文本格式属性:num honderlines:0 delimiter:','rowdelimiter:','rowdelimiter:'\ r \ r \ n'instamissing:'''遗漏value:nan高级文本格式属性:textscanformats:{'%f','%f','%f'和26更多} texttype:'char'epententcharacters:'eedd''commentstyle:''fhiteSpace:'\ b \ t'multipledelimitersasone:false属性控制通过预览,阅读,readall:selectedvariablenames:{'年','月份,'dayofmonth'和26更多}SENSELESFORMATS:{'%f','%f','%f'...和26更多} readsize:20000行outputType:'表'Rowimes:[]写入特定属性:SupportedOutpormats:[“TXT”“CSV万博1manbetx“”XLSX“”XLS“”镶木地板“”PARQ“] DEFaultOutputFormat:“TXT”
データストアを作成すると,すべてのデータをメモリに読み込まなくても対象のデータをプレビューできます。sedicentvariablenames.
プロパティを使用して目的の変数(列)を指定し,その変数だけをプレビュー表示したり読み取ったりできます。
ds.selectedvariablenames = {'deptime'那'depdelay'};预览(DS)
ans = 8×2表Deptime depdelay _______ ________ 642 12 10211 2055 20 1332 12 629 -1 1446 63 928 -2 859 -1
欠损欠损値を表す表すデータ値を指定できますairlinesmall.csv
では,欠损値は纳
で表されます。
ds.treatasmissing ='na';
データストア内の目的のの数に关键词すべてのデータがががメモリにに收まるは收まるははははははははははははは,关联读物
を使用してそのデータを読み取ることができます。
t = readall(DS);
それ疏户外の合并は,关字读
关注使用してメモリ收まる小さなサブセットとしてデータを読み取ります読み取り読み取り读
は既定で,TabularTextDatastore
から一度に20,000行ずつ読み取ります。ただし,この値は阅读
プロパティに新しい値を代入して変更できます。
ds.readsize = 15000;
关节有关部重启
を使用して,再度読み取る前にデータストアを初期状态にリセットします。尽管
ループ内で关流读
を呼び出して,各データのサブセットで中间计算を実行から,最后に中间结果を集计ます。DEPDELAY.
の最大値を计算しています。
重置(DS)x = [];尽管Hasdata(DS)T =读取(DS);x(end + 1)= max(t.depdelay);结尾maxdelay = max(x)
maxDelay = 1438
-读
の各呼び出しで特定の行数ではなく1つのファイル全体を読み取るように指定できます。
重置(DS)DS.ReadSize ='文件';x = [];尽管Hasdata(DS)T =读取(DS);x(end + 1)= max(t.depdelay);结尾maxdelay = max(x);
データデータストア内ののデータのサブセットの読み取り加入mapreduce.
をを用して映射关关节と减少有关部をデータストアストア适でき。また,高
を使用して高大配列を作品成することできます。详细详细について,MapReduce入門とメモリに收まらないデータの高大配列を参照してください。
tabularTextDatastore
|ImageageAtastore.
|SpreadsheetDatastore.
|KeyValuedAtastore.
|filedatastore.
|高
|mapreduce.