分析大数据在数据库使用高数组
这个例子中决定了大量的延误最小的飞行数据存储在数据库中。您可以访问大型数据集,并创建一个高阵列使用DatabaseDatastore
对象与数据库工具箱™。一旦存在高数组,你可以想象高数组中的数据。或者,您可以编写一个MapReduce算法,定义了数据分块和减少。
的DatabaseDatastore
对象不支持使用并行池与并行计算工万博1manbetx具箱™安装。使用高阵列分析数据或运行MapReduce算法,设置全局执行环境是当地的MATLAB®会话。
这个例子使用一个预先配置的JDBC数据源创建数据库连接。有关更多信息,请参见
函数。configureJDBCDataSource
创建DatabaseDatastore
对象
设置全局执行环境是当地的MATLAB®会话。
mapreduce (0);
该文件airlinesmall.csv
包含了大量的飞行数据。这个文件加载到Microsoft®SQL Server®数据库表中airlinesmall
。此表包含123523条记录。
创建一个数据库连接到JDBC数据源MSSQLServerJDBCAuth
。这个数据源配置JDBC驱动程序到Microsoft®SQL Server使用Windows®®数据库的身份验证。指定一个空白的用户名和密码。
数据源=“MSSQLServerJDBCAuth”;用户名=”“;密码=”“;康涅狄格州=数据库(数据源、用户名、密码);
创建一个DatabaseDatastore
使用数据库连接对象和一个SQL查询。这个SQL查询检索延误的数据airlinesmall
表。databaseDatastore
执行SQL查询。
sqlquery =“从airlinesmall选择ArrDelay”;sqlquery dbd = databaseDatastore(康涅狄格州,“ReadSize”,50000);
找到最小延误使用高数组
因为DatabaseDatastore
对象返回一个表,创建一个高表。
tt =高(dbd);
找到最小延迟到来。
minArrDelay = min (tt.ArrDelay);
minArrDelay
包含未鉴定的最小延迟到来。返回的输出值,使用收集
。有关详细信息,请参见延迟评价高数组。
minArrDelayValue =收集(minArrDelay)
评估高表达式使用当地的MATLAB会话:通过1 1:在1.6秒完成评估在1.9秒完成minArrDelayValue = -64
除了确定最小,高数组支持许多其他功能。万博1manbetx有关详细信息,请参见万博1manbetx支持功能。
关闭DatabaseDatastore
对象和数据库连接
关上(dbd)
另请参阅
databaseDatastore
|数据库
|收集
|最小值
|柱状图
|mapreduce
|高