MapReduce编程模型
将作业拆分为Map和Reduce两个阶段
- 准备map处理的输入数据
- Mapper处理
- Shuffle
- Reduce处理
- 结果输出
入门:编写MapReduce程序
编写wordcount程序
- 编辑pom.xml,添加jar包
1 | <dependency> |
- 编写Mapper类
1 | package com.biezhi.bigdata.hadoop.hdfs.mapreduce; |
- 编写Reducer类
1 | package com.biezhi.bigdata.hadoop.hdfs.mapreduce; |
- 编写主类,提交MR作业
1 | package com.biezhi.bigdata.hadoop.hdfs.mapreduce; |