第六周 第四章 Hadoop官方文档使用指北
Hadoop官方文档使用指北
1 | 前面我们把Hadoop中的HDFS、MapReduce、YARN中比较常用和重要的功能基本都学习完了,但是在后续工作中可能会遇到一些特殊的场景需要用到特殊的知识点,这个时候就需要考验大家的自学能力了,以及后期你再遇到一些新的技术框架,想要从0开始学习的时候 |
1 | 想要学习框架中的一些知识点,需要点击文档链接进去,但是目前hadoop官网的这个文档链接是有问题的,毕竟是免费开源的,大家就忍了吧 |
1 | 我们看文档左边的菜单,往下面拉,这里面有HDFS、MapReduce、YARN的内容 |

1 | 大致的步骤就这样了,剩下的就是需要具体看里面的细节内容了。 |
Hadoop在CDH和HDP中的使用
1 | 咱们前面学习了官方的Apache Hadoop版本,我们前面也说了,在实际工作中其实会使用CDH或者HDP,那下面我们就看一下在CDH和HDP中如何操作Hadoop。 |
1 | 这两个文件可以通过vmware打开,里面已经安装好了CDH和HDP,可以在一台机器上启动,模拟正常的集群环境,这都是在官网上下载的,可以直接使用,非常简单,我们在这主要是为了演示一下如何在CDH和HDP中操作Hadoop,其实说实话,他们在操作的时候没有什么区别,和我们操作原生版本的Hadoop一样,但是呢如果不带着大家去亲身感受一把,大家心里面总是感觉有点虚。 |
下面我们就来先演示一下CDH
1 | 先解压,再使用vmware直接打开即可,选择本地的镜像文件,在这里最好选择centos6.7的iso镜像文件,因为这个操作系统的版本就是centos6.7。 |

1 | 接着启动这个虚拟机即可。 |

1 | 这里面除了有Hadoop的相关进程,还有其他大数据框架的进程 |
1 | 我们尝试操作一下hdfs |



1 | 在这里同样可以访问HDFS的web界面和YARN的web界面 |


1 | YARN的web界面 |

1 | 剩下的就没什么区别了,基本使用都是一样的。 |
接下来看一下HDP

1 | 根据里面的提示,访问http://192.168.182.130:1080界面;ip是这个虚拟机的ip,这个虚拟机里用docker安装的HDP |

1 | 点击左侧的LAUNCH DASHBOARD |


1 | 登录之后会进入如下界面,在HDP中有一个ambari服务,这个服务提供的这个web界面 ,在这个界面中可以很方便的管理大数据组件,这里面就包含我们学习过的HDFS、MapRedcue、YARN。 |

1 | 下面我们想在命令行下操作一下hdfs,但是这里面并没有命令行,但是它提供了一个基于界面的shell命令行 |

1 | 访问 http://192.168.182.130:4200 |

1 | 接下来就可以操作了 |

1 | 这样也可以访问,端口还是8020 |

1 | 接下来我们访问一下HDFS的web界面和YARN的web界面 |

1 | YARN的web界面,端口是8088 |
