hadoop理论课-第五章Mapreduce
MapreduceMapReduce概述MapReduce是什么?Mapreduce是一种简化并行计算的编程模型,用于进行大数据量的计算
MapReduce设计思想
MapReduce特点易于编程良好的扩展性高容错性擅长对PB级以上海量数据进行离线处理MapReduce不擅长的场景实时计算MapReduce无法像MySQL一样,在毫秒或秒级内返回结果
流式计算流式计算的输入数据是动态的,而MapReduce的输入数据集是静态的,动态变化
DAG(有向图)计算MapReduce编程模型初识MapReduce模型
MR原语: 相同的key为一组,调用一次reduce方法,迭代计算这一
...