MATLAB处理大数据
查看时间表和注册课程详细信息
这个为期一天的课程的重点是调整现有的算法,以处理一组数据文件或一个太大而无法装入内存的单个文件。学习在MATLAB中表示大数据®,调整现有代码以有效地使用它,并扩大分析以利用您自己的计算资源或云。
主题包括:
- 创建从数据源读取的数据存储
- 使用高数组表示和操作大数据
- 导入自定义数据格式并将自定义函数应用到tall数组
- 使用计算机集群和云环境
第一天
原型化大数据算法
摘要目的:将现有算法应用于不适合内存的数据集。
- 通过数据存储导入数据
- 创建高数组
- 在高数组上运行算法
- 优化高数组的代码
- 从云环境读取数据
处理自定义数据和算法
摘要目的:导入自定义格式化数据并应用未为高数组实现的算法
- 使用文件数据存储和自定义数据存储导入自定义格式化的数据
- 部分导入单个文件
- 将转换、缩减和移动窗口操作应用到高数组
使用集群和云
摘要目的:在计算机集群或云环境中运行大数据算法。
- 本地和远端集群
- 集群发现和连接
- 在云环境上设置集群
- 文件访问注意事项