主要内容

分析大数据在数据库使用高数组

这个例子中决定了大量的延误最小的飞行数据存储在数据库中。您可以访问大型数据集,并创建一个高阵列使用DatabaseDatastore对象与数据库工具箱™。一旦存在高数组,你可以想象高数组中的数据。或者,您可以编写一个MapReduce算法,定义了数据分块和减少。

DatabaseDatastore对象不支持使用并行池与并行计算工万博1manbetx具箱™安装。使用高阵列分析数据或运行MapReduce算法,设置全局执行环境是当地的MATLAB®会话。

这个例子使用一个预先配置的JDBC数据源创建数据库连接。有关更多信息,请参见configureJDBCDataSource函数。

创建DatabaseDatastore对象

设置全局执行环境是当地的MATLAB®会话。

mapreduce (0);

该文件airlinesmall.csv包含了大量的飞行数据。这个文件加载到Microsoft®SQL Server®数据库表中airlinesmall。此表包含123523条记录。

创建一个数据库连接到JDBC数据源MSSQLServerJDBCAuth。这个数据源配置JDBC驱动程序到Microsoft®SQL Server使用Windows®®数据库的身份验证。指定一个空白的用户名和密码。

数据源=“MSSQLServerJDBCAuth”;用户名=”“;密码=”“;康涅狄格州=数据库(数据源、用户名、密码);

创建一个DatabaseDatastore使用数据库连接对象和一个SQL查询。这个SQL查询检索延误的数据airlinesmall表。databaseDatastore执行SQL查询。

sqlquery =“从airlinesmall选择ArrDelay”;sqlquery dbd = databaseDatastore(康涅狄格州,“ReadSize”,50000);

找到最小延误使用高数组

因为DatabaseDatastore对象返回一个表,创建一个高表。

tt =高(dbd);

找到最小延迟到来。

minArrDelay = min (tt.ArrDelay);

minArrDelay包含未鉴定的最小延迟到来。返回的输出值,使用收集。有关详细信息,请参见延迟评价高数组

minArrDelayValue =收集(minArrDelay)
评估高表达式使用当地的MATLAB会话:通过1 1:在1.6秒完成评估在1.9秒完成minArrDelayValue = -64

除了确定最小,高数组支持许多其他功能。万博1manbetx有关详细信息,请参见万博1manbetx支持功能

关闭DatabaseDatastore对象和数据库连接

关上(dbd)

另请参阅

||||||

相关的例子

更多关于

外部网站