MapReduce
用于分析不适合记忆的数据集的编程技术
句法
描述
例子
输入参数
输出参数
提示
调试您
MapReduce
检查键值对如何在不同阶段移动的算法总是有用的。要检查数据的运动,请在地图中设置断点并减少功能。断点停止执行MapReduce
,允许您检查相关变量的当前状态,例如KeyValuestore
或者ValueIterator
。有关更多信息,请参阅DEBUG MAPREDUCE算法。一些优化的建议
MapReduce
在任何平台上的性能是:最小化对地图功能的调用数量。最简单的方法是增加
读取尺寸
输入数据存储的属性。结果是MapReduce
将较大的数据块传递到地图函数,而数据存储耗尽的读数较少。减少在地图和减少功能之间发送的中间数据的量。一种方法是使用
独特的
在地图功能中以组合相似的键。看使用MapReduce按组计算平均值作为此技术的示例。