主要内容

Introducción a los almacene de datos

¿Qué es un almacén de datos?

Un almacén de datos es Un para la lecture de Un único archive o una recopilación de archivos o datos。El almacén de datos actúa como repository para los datos que tienen la misma structura El mismo formato。在这里,可以找到关于档案的资料almacén关于档案的资料(网址numéricos texto)关于档案的资料,可以找到关于边界的资料。

Un almacén de datos es útil cuando:

  • 档案之门recopilación记忆之门recopilación记忆之门。Un almacén de datos le permite leer y analizar datos de cada archiivo en porciones más pequeñas que sí记忆之家。

  • la档案recopilación武断的原则。Un almacén de datos actúa como Un repository de archivos en una o más地毯。没有必要对档案进行保密。

我们在一起almacén我们在一起aplicación。与之不同的是,与之不同的是,与之不同的是,与之不同的是。我的朋友,我的朋友,我的朋友,我的朋友,我的朋友,我的朋友®.关于完整的资料清单,咨询选择“文件格式”或“应用程序”的数据存储

档案资料 Tipo de almacén de datos
《欧洲大陆资料资料汇编汇编》,包括《欧洲大陆资料汇编汇编》 TabularTextDatastore
图像档案,包括辅助格式imreadcomo JPEG y PNG。 ImageDatastore
档案cálculo Excel格式汇编®admitidos科莫.xlsx SpreadsheetDatastore
以价为本,以价为本,以价为本mapreduce KeyValueDatastore
东方圆柱档案馆。 ParquetDatastore
个性化档案格式。Requiere una función比例,para la lecture de datos。 FileDatastore
Almacén关于管制的资料 TallDatastore

Crear y leer a partir de un almacén de datos

使用la funcióntabularTextDatastorePara crear UN almacén关于精神档案的资料airlinesmall.csv, que continene la información de llegada y salida de vuelos de aerolíneas个人。结果不反对TabularTextDatastore

ds = tabularTextDatastore(“airlinesmall.csv”
ds = TabularTextDatastore属性:文件:{'…\matlab\toolbox\matlab\demos\ airlinsmall .csv'}文件夹:{'…\matlab\toolbox\matlab\demos'} FileEncoding: 'UTF-8' AlternateFileSystemRoots: {} preservvariablenames: false ReadVariableNames: true VariableNames: {'Year', 'Month', 'DayofMonth'…和26个更多}DatetimeLocale: en_US文本格式属性:NumHeaderLines: 0分隔符:',' RowDelimiter: '\r\n' TreatAsMissing: " MissingValue: NaN高级文本格式属性:TextscanFormats: {'%f', '%f', '%f'…TextType: 'char' ExponentCharacters: 'eEdD' CommentStyle: "空格:' \b\t' MultipleDelimitersAsOne: false属性,控制表返回预览,读取,readall: SelectedVariableNames:{'年','月','月日'…和26}SelectedFormats: {% f ', ' % f ', ' % f '……ReadSize: 20000行OutputType: 'table' RowTimes:[]写属性:supportedoutputformat: ["txt" "csv" "xlsx" 万博1manbetx"xls" "parquet" "parq"] DefaultOutputFormat: "txt"

Después我们的记忆almacén我们的记忆,我们的记忆。Puede特定变量(列)de interés mediante la丙烯SelectedVariableNamesPara previsualizar o leer únicamente dichas变量。

ds。SelectedVariableNames = {“DepTime”“DepDelay”};预览(ds)
ans = 8×2 table DepTime DepDelay _______ ________ 642 12 1021 1 2055 20 1332 12 629 1 1446 63 928 2 859 1

Puede,特别是,los, valores, de, datos, que,代表,valores, ausentes。在airlinesmall.csv,我们的价值是我们的代表NA

ds。TreatAsMissing =“NA”

关于记忆的事almacén关于变量的事interés关于记忆的事,关于中间的事funciónreadall

T = readall(ds);

相反的,下面的数据más pequeños que sí中间的回忆función.形式上的预先决定,la función2万美元是联合国的一部分TabularTextDatastore.罪恶的禁令,以仁慈之心换取新的仁慈之心ReadSize

ds。ReadSize = 15000;

可重建的地方almacén关于中间地带的临时数据función重置.lamando a la funciónEn UN bucle, puede realizar cálculos在数据和数据的次连接上的中间和最终的中间。Este código calcula el valor máximo de la变量DepDelay

reset(ds) X = [];hasdata(ds) T = read(ds);X(end+1) = max(T.DepDelay);结束maxDelay = max(X)
maxDelay = 1438

我的档案档案,个人的记忆小屋,特别的美洲驼之家Debe leer UN archivo complete en lugar de UN número de filas concrete to。

重置(ds) ds。ReadSize =“文件”;X = [];hasdata(ds) T = read(ds);X(end+1) = max(T.DepDelay);结束maxDelay = max(X);

此外de秋波subconjuntos de拿督在联合国almacen de拿督,喝水aplicar y减少en el almacen de las一些必要地图拿督mediantemapreduce哦,我很高兴,我很高兴.Para obtener más información, consulteMapReduce入门y没有充分的证据

Consulte也

||||||

特马relacionados