本文介绍了基于docker部署hadoop环境的说明。
1. 概述
可以直接从docker hub下载,docker pull tyrival/hadoop
https://hub.docker.com/r/tyrival/hadoop
也可以基于centos镜像手工构建
1 | centos镜像版本: 7.5.1804 |
hadoop和jdk下载完成后放在~/Documents/Workspace/Docker/hadoop
文件夹中
2. 部署过程
1. 启动并进入centos容器
1 | # 将下载的hadoop和jdk放在~/Documents/Workspace/Docker/hadoop中 |
2. 安装软件
1 | # 安装必要软件 |
3. hadoop准备
1 | # 在hadoop目录下创建三个文件夹, |
4. hadoop设置
vim core-site.xml
1 | <configuration> |
vim hdfs-site.xml
1 | <configuration> |
vim mapred-site.xml
1 | <configuration> |
vim yarn-site.xml
1 | <configuration> |
5. 配置slave节点
1 | cd $HADOOP_HOME |
内容如下:
1 | slave1 |
6. ssh key
生成ssh key,配置节点间的相互访问
1 | cd ~/ |
7. 配置启动项
新建启动脚本vi /root/run.sh
,内容如下:
1 |
|
设置脚本权限chmod +x /root/run.sh
退出容器exit
8. 保存镜像
1 | # 5e为当前容器的id,hadoop为新建的镜像名称,v1为镜像版本 |
9. 启动节点
1 | docker run -d -p 10012:22 --name slave1 hadoop:v1 /root/run.sh |
10. 启动hadoop
1 | # 进入master容器 |
11. 验证
访问 http://localhost:50070 ,进入datanode页面,可以看到有2个节点。