主要内容

大数据处理

使用分布式阵列、高阵列、数据存储等并行分析大数据集mapreduce在火花®和Hadoop®集群

您可以使用Parallel Computing Toolbox™在多个MATLAB®工作人员之间并行分布大型数组,这样您就可以运行使用集群组合内存的大数据应用程序。您将整个数组作为一个单独的实体进行操作,但是,工作人员仅在他们所在的数组部分进行操作,并在必要时在他们之间自动传输数据。并行计算工具箱还可以让您执行MATLAB®高大的数组,数据存储并行计算,以便分析无法放入集群内存的大数据集。您可以使用MATLAB并行服务器™跑高阵和数据存储在启用Spark的Hadoop集群上并行计算。这样做可以显著减少非常大的数据计算的执行时间。

  • 分布式阵列
    使用分布式数组和同步执行并行分析大数据集
  • 高数组和mapreduce
    分析大数据集并行使用MATLAB高数组和数据存储或mapreduceSpark和Hadoop集群,以及并行池

特色的例子