使用MATLAB处理大数据
查看时间表和注册课程详情
这项为期一天的课程着重于调整现有算法来处理数据文件的集合或单个文件,该文件太大而无法适合内存。学会在MATLAB中代表大数据®,调整现有代码以有效地与之合作,并扩展分析以利用您自己的计算资源或云。
主题包括:
- 创建数据存储以从数据源读取
- 使用高阵列代表和操纵大数据
- 导入自定义数据格式并将自定义功能应用于高阵列
- 使用计算机和云环境群
第1天的第1天
原型大数据算法
客观的:将现有算法应用于不适合内存的数据集。
- 使用数据存储导入数据
- 创建高阵列
- 在高阵列上运行算法
- 优化高阵列的代码
- 从云环境中读取数据
处理自定义数据和算法
客观的:导入自定义格式化数据和应用未实现的算法
- 使用文件数据存储和自定义数据存储导入自定义格式化数据
- 部分导入单个文件
- 将转换,减少和移动的窗户操作应用于高阵列
与群集和云一起工作
客观的:在计算机群或云环境中运行大数据算法。
- 本地和远程集群
- 集群发现和连接
- 在云环境上的集群设置
- 文件访问注意事项