主要内容

高大阵列和Mapreduce.

使用MATLAB分析大数据集®高阵列和数据存储或Mapreduce.在火花上®和Hadoop.®集群和平行池

您可以使用并行计算工具箱™使用桌面上的并行池并行评估高阵列表达式。使用高阵列允许您运行不适合计算机上内存的大数据应用程序。您还可以使用“并行计算”工具箱来通过连接到运行的并行池来扩展高阵列处理MATLAB并行服务器™簇。或者,您可以使用启用的火花Hadoop集群运行MATLAB并行服务器。有关更多信息,请参阅使用高阵列和数据存储的大数据工作流程

职能

展开全部

创建高阵列
数据存储 为大型数据集创建数据存储
Mapreduce. 用于分析不适合内存的数据集的编程技术
Mapreducer. 定义MapReduce和高阵列的并行执行环境
划分 分区数据存储
numpartitions. 数据存储区分区数量
parpool. 在群集中创建并行池
GCP. 获取当前并行池

班级

展开全部

并行.Pool. 平行池工人
并行.Cluster.Hadoop. Mapreducer,MapReduce和高阵列的Hadoop集群

例子和如何

使用高阵列和数据存储的大数据工作流程

了解使用高阵列分析大数据集的典型工作流程。

在平行池上使用高阵列

在并行计算工具箱中发现高阵列MATLAB并行服务器

处理云中的大数据

此示例显示如何访问云中的大数据并使用Matlab功能进行大数据的Matlab功能在云群中进行处理。

使用高阵列在启用的HADOOP集群上

在不改变MATLAB代码的情况下在Spark Clusters上创建和使用高表。

在并行池中运行mapreduce

尝试Mapreduce.使用并行计算工具箱的大数据的高级分析。

在hadoop集群上运行mapreduce

学习关于Mapreduce.对于Hadoop集群的高级大数据分析。

并行分区数据存储

划分拆分你的数据存储进入较小的部分。

概念

并行池中运行代码

了解开始和停止并行池,池大小和群集选择。

指定您的并行偏好

指定您的首选项,并自动创建并行池。

发现群集并使用群集配置文件

了解如何使用群集配置文件并发现在Amazon EC2上运行的云群集。

特色例子