用MATLAB处理大数据
查看日程安排和注册课程详细信息
这个为期一天的课程的重点是调整现有的算法来处理一组数据文件或一个太大而无法装入内存的文件。学习在MATLAB中表示大数据®,调整现有代码以有效地使用它,并扩大分析以利用您自己的计算资源或云。
主题包括:
- 创建从数据源读取的数据存储
- 使用高数组表示和操作大数据
- 导入自定义数据格式,并对高数组应用自定义函数
- 使用计算机集群和云环境
第一天
大数据算法原型
摘要目的:将现有算法应用于无法装入内存的数据集。
- 使用数据存储导入数据
- 创造高的数组
- 在高数组上运行算法
- 优化高数组的代码
- 从云环境读取数据
处理自定义数据和算法
摘要目的:导入自定义格式化数据并应用没有为高数组实现的算法
- 使用文件数据存储和自定义数据存储导入自定义格式化的数据
- 部分导入单个文件
- 应用转换、约简和将窗口操作移动到高数组
使用集群和云
摘要目的:在计算机集群或云环境中运行大数据算法。
- 本地集群和远端集群
- 集群发现和连接
- 在云环境上设置集群
- 文件访问的考虑