登录注册写文章

Hadoop学习笔记（MR执行流程）

Hadoop学习笔记（MR执行流程）

执行MR的命令：
hadoop jar <jar在linux的路径> <main方法所在的类的全类名> <参数>
例子：
hadoop jar /root/wc1.jar cn.itcast.d3.hadoop.mr.WordCount hdfs://itcast:9000/words /out2
MR执行流程
(1).客户端提交一个mr的jar包给JobClient(提交方式：hadoop jar ...)
(2).JobClient通过RPC和JobTracker进行通信，返回一个存放jar包的地址（HDFS）和jobId
(3).client将jar包写入到HDFS当中(path = hdfs上的地址 + jobId)
(4).开始提交任务(任务的描述信息，不是jar, 包括jobid，jar存放的位置，配置信息等等)
(5).JobTracker进行初始化任务
(6).读取HDFS上的要处理的文件，开始计算输入分片，每一个分片对应一个MapperTask
(7).TaskTracker通过心跳机制领取任务（任务的描述信息）
(8).下载所需的jar，配置文件等
(9).TaskTracker启动一个java child子进程，用来执行具体的任务（MapperTask或ReducerTask）
(10).将结果写入到HDFS当中

最后编辑于：2017.12.06 02:42:00

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

MapReduce/Yarn详解
MapReduce框架结构## MapReduce是一个用于大规模数据处理的分布式计算模型MapReduce模型主...
Bloo_m阅读 9,194评论 0赞 4
Hadoop 简明教程
目的这篇教程从用户的角度出发，全面地介绍了Hadoop Map/Reduce框架的各个方面。先决条件请先确认Had...
SeanC52111阅读 5,701评论 0赞 1

hadoop中NameNode、DataNode、Secondary、NameNode、Job...
1.job的本质是什么？ 2.任务的本质是什么？ 3.文件系统的Namespace由谁来管理，Namespace的...
云中捞月阅读 5,438评论 0赞 3
愿你明媚不忧伤勇敢做自己的太阳
我不是什么鸡汤写手也不是什么反鸡汤人士我是一只“鸡” 活蹦乱跳的“鸡”啊一直不甘于现状却又比谁都过得安逸 ...
还是你蛋哥阅读 3,012评论 2赞 1
美人如斯
你眉目如画，醉了谁的眼；你泪眼婆娑，惹了谁人怜。你如画如诗亦如谜。一眼，仅一眼，为你如痴如狂亦如癫。
瞎眼陈阅读 1,690评论 1赞 2

赞1赞

赞赏

手机看全文