主要内容

使用高数组分析数据库中的大数据

此示例确定存储在数据库中的一组大型航班数据的最小到达延迟。您可以访问大型数据集并使用DatabaseDatastore对象与数据库工具箱™。一旦存在高数组,就可以在高数组中可视化数据。或者,您可以编写一个MapReduce算法来定义数据的分块和缩减。

DatabaseDatastore对象不支持使用安装了并行计算工具万博1manbetx箱™的并行池。使用高数组分析数据或运行MapReduce算法,将全局执行环境设置为本地MATLAB®会话。

这个示例使用一个预先配置的JDBC数据源来创建数据库连接。有关更多信息,请参见configureJDBCDataSource函数。

创建DatabaseDatastore对象

设置全局执行环境为本地MATLAB®会话。

mapreduce (0);

该文件airlinesmall.csv包含大量的飞行数据。将此文件加载到Microsoft®SQL Server®数据库表中airlinesmall.该表包含123,523条记录。

创建到JDBC数据源的数据库连接MSSQLServerJDBCAuth.该数据源将JDBC驱动程序配置到具有Windows®身份验证的Microsoft®SQL Server®数据库。请指定一个空白的用户名和密码。

数据源=“MSSQLServerJDBCAuth”;用户名="";密码="";康涅狄格州=数据库(数据源、用户名、密码);

创建一个DatabaseDatastore对象使用数据库连接和SQL查询。的到达延迟数据airlinesmall表格databaseDatastore执行SQL查询。

sqlquery ='select ArrDelay from airlineslittle ';sqlquery dbd = databaseDatastore(康涅狄格州,“ReadSize”, 50000);

使用高阵求最小到达延迟

因为DatabaseDatastore对象返回一个表,创建一个高表。

tt =高(dbd);

找出最小到达延迟。

minArrDelay = min (tt.ArrDelay);

minArrDelay包含未评估的最小到达延迟。要返回输出值,请使用收集.有关详细信息,请参见高数组的递延求值

minArrDelayValue =收集(minArrDelay)
using the Local MATLAB Session: - Pass 1 of 1: Completed in 1.6 sec

除了确定最小值外,高数组还支持许多其他函数。万博1manbetx有关详细信息,请参见万博1manbetx支持功能

关闭DatabaseDatastore对象和数据库连接

关上(dbd)

另请参阅

||||||

相关的例子

更多关于

外部网站