Docker搭建Hadoop集群

Yu_Huang 发布于2019-06-28 15:02 / 3780人阅读

摘要：搭建集群首先搭建环境版本大于安装主机监控程序和加速器这里使用了的版本，因为安装方便放开更改放开配置配置配置配置配置配置文件追加配置和在文件第一行中添加测试链接文件

Docker搭建Hadoop集群

首先搭建Docker环境,Docker版本大于1.3.2

安装主机监控程序和加速器(curl -sSL https://get.daocloud.io/daomonit/install.sh | sh -s 7a029f60d36056fe1b85fabca6a133887245abe6)

docker pull daocloud.io/library/centos:centos6.7

docker run -it -h master --name master insaneworks/centos /bin/bash

yum install -y gcc vim openssh-server openssh-clients java-1.7.0-openjdk-devel.x86_64 tar wget

</>复制代码 
这里java使用了openjdk1.7.0的版本，因为安装方便

vim /etc/ssh/sshd_config

</>复制代码 
放开PermitEmptyPasswords no
更改UsePAM no
放开PermitRootLogin yes

/etc/rc.d/init.d/sshd start

ssh-keygen -t rsa -P ""

cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

配置/etc/profile

</>复制代码 
export JAVA_HOME=/usr/lib/jvm/java-1.7.0-openjdk.x86_64/
export CLASSPATH=.:$JAVA_HOME/lib/dt:$JAVA_HOME/lib/tools.jar
export HADOOP_HOME=/root/hadoop-2.7.1
export PATH=$JAVA_HOME/bin:$PATH:$HADOOP_HOME/bin

11. 配置core-site.xml

</>复制代码 
    
        fs.defaultFS
        hdfs://master:9000
    
    
        fs.defaultFS
        hdfs://master:9000
    
    
        io.file.buffer.size
        131702
    
    
        hadoop.tmp.dir
        file:/root/hadoop-2.7.1/tmp

12. 配置hdfs-site.xml

</>复制代码 
    
        dfs.namenode.name.dir
        file:/root/hadoop-2.7.1/dfs/name
    
    
        dfs.datanode.data.dir
        file:/root/hadoop-2.7.1/dfs/data
    
    
        dfs.replication
        2
    
    
        dfs.namenode.secondary.http-address
        master:9001
    
    
        dfs.webhdfs.enabled
        true

13. 配置mapred-site.xml

</>复制代码 
    
        mapreduce.framework.name
        yarn
    
    
        mapreduce.jobhistory.address
        master:10020
    
    
        mapreduce.jobhistory.webapp.address
        master:19888

14. 配置yarn.site.xml

</>复制代码 
    
        yarn.nodemanager.aux-services
        mapreduce_shuffle
    
    
        yarn.nodemanager.auxservices.mapreduce.shuffle.class
        org.apache.hadoop.mapred.ShuffleHandler
    
    
        yarn.resourcemanager.address
        master:8032
    
    
        yarn.resourcemanager.scheduler.address
        master:8030
    
    
        yarn.resourcemanager.resource-tracker.address
        master:8031
    
    
        yarn.resourcemanager.admin.address
        master:8033
    
    
        yarn.resourcemanager.webapp.address
        master:8088
    
    
        yarn.nodemanager.resource.memory-mb
        1024

15. 配置etc/hadoop/slaves文件

</>复制代码 
追加
slave1
slave2
slave3

16. 配置hadoop-env.sh和yarn-env.sh

</>复制代码 
在文件第一行中添加：export JAVA_HOME=/usr/lib/jvm/java-1.7.0-openjdk.x86_64/

17. 测试链接文件

</>复制代码 
ldd /root/hadoop-2.7.1/lib/native/libhadoop.so.1.0.0
/root/hadoop-2.7.1/lib/native/libhadoop.so.1.0.0: /lib64/libc.so.6: version `GLIBC_2.14" not found (required by /root/hadoop-2.7.1/lib/native/libhadoop.so.1.0.0)
linux-vdso.so.1 => (0x00007fff24dbc000)
libdl.so.2 => /lib64/libdl.so.2 (0x00007ff8c6371000)
libc.so.6 => /lib64/libc.so.6 (0x00007ff8c5fdc000)
/lib64/ld-linux-x86-64.so.2 (0x00007ff8c679b000)

18. 安装glibc-2.14

</>复制代码 
tar zxvf glibc-2.14.tar.gz
cd glibc-2.14
mkdir build
cd build
../configure --prefix=/usr/local/glibc-2.14
make
make install
ln -sf /usr/local/glibc-2.14/lib/libc-2.14.so /lib64/libc.so.6

19. 测试链接文件

</>复制代码 
ldd /root/hadoop-2.7.1/lib/native/libhadoop.so.1.0.0
linux-vdso.so.1 => (0x00007fff72b7c000)
libdl.so.2 => /lib64/libdl.so.2 (0x00007fb996ce9000)
libc.so.6 => /lib64/libc.so.6 (0x00007fb99695c000)
/lib64/ld-linux-x86-64.so.2 (0x00007fb997113000

20. 提交改镜像即可

</>复制代码 
docker commit master ice/hadoop

21. 查看镜像列表

</>复制代码 
docker images
REPOSITORY                              TAG                 IMAGE ID            CREATED             VIRTUAL SIZE
ice/hadoop              latest              385a97765871        7 hours ago         1.731 GB
daocloud.io/library/centos              centos6.7           3fba1048142f        11 days ago         190.6 MB
daocloud.io/daocloud/daocloud-toolset   latest              aa5dc2eecd4a        6 weeks ago         145.8 MB
daocloud.io/daocloud/daomonit           latest              ae375c157c27        7 weeks ago         149 MB

22. 干掉该配置镜像

</>复制代码 
docker rm master

23. 启动集群脚本

</>复制代码 
docker run --rm -it -p 50070:50070 -p 19888:19888 -p 8088:8088 -p 50030:50030 -h master --name master ice/hadoop /bin/bash
docker run --rm -it -h slave1 --name slave1 ice/hadoop /bin/bash
docker run --rm -it -h slave2 --name slave2 ice/hadoop /bin/bash
docker run --rm -it -h slave3 --name slave3 ice/hadoop /bin/bash

24. 配置环境变量和sshd服务

</>复制代码 
source /etc/profile
/etc/rc.d/init.d/sshd start

25. 查看各个节点的IP

</>复制代码 
docker inspect --format="{{.NetworkSettings.IPAddress}}" master
docker inspect --format="{{.NetworkSettings.IPAddress}}" slave1
docker inspect --format="{{.NetworkSettings.IPAddress}}" slave2
docker inspect --format="{{.NetworkSettings.IPAddress}}" slave3

26. 启动Hadoop集群

</>复制代码 
hadoop namenode -format
/root/hadoop-2.7.1/sbin/start-dfs.sh
/root/hadoop-2.7.1/sbin/start-yarn.sh
注意⚠️第一执行脚本时，需要确认一次

27. 关闭脚本

</>复制代码 
/root/hadoop-2.7.1/sbin/stop-dfs.sh
/root/hadoop-2.7.1/sbin/stop-yarn.sh

28. 测试命令

</>复制代码 
hadoop fs -mkdir /input
hadoop fs -ls /
hadoop fs -put /root/hadoop-2.7.1/etc/hadoop/* /input/
hadoop jar /root/hadoop-2.7.1/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.1.jar wordcount /input/ /output/wordcount/

USDP大数据平台 hadoop 集群搭建搭建hadoop集群 hadoop集群搭建 hadoop集群环境搭建

文章版权归作者所有，未经允许请勿转载,若此文章存在违规行为，您可以联系管理员删除。

转载请注明本文地址：https://www.ucloud.cn/yun/26479.html

基于Docker搭建Hadoop集群之升级版

摘要：总之，项目还算很受欢迎吧，这篇博客将介绍项目的升级版。一项目介绍将打包到镜像中，就可以快速地在单个机器上搭建集群，这样可以方便新手测试和学习。之前的版本使用为集群提供服务，由于网络功能更新，现在并不需要了。运行参考第二部分启动，并运行。摘要: kiwenlau/hadoop-cluster-docker是去年参加Docker巨好玩比赛开发的，得了二等奖并赢了一块苹果手表，目前这个项目...

Zoom 2019-06-28 15:13 评论0 收藏0
Docker搭建Zookeeper集群

Docker搭建Zookeeper集群这之前的准备和Docker搭建Hadoop集群是一样的，请关注上一篇笔记。第一步根据上次wiki中的方法启动docker容器 docker run --rm -it -h zoo1 --name zoo1 ice/hadoop /bin/bash docker run --rm -it -h zoo2 --name zoo2 ice/hadoop /bin...

CNZPH 2019-06-28 15:02 评论0 收藏0
Docker中Hadoop环境搭建

使用腾讯云主机，docker构建集群测试环境。环境 1、操作系统： CentOS 7.2 64位网路设置 hostname IP cluster-master 172.18.0.2 cluster-slave1 172.18.0.3 cluster-slave2 172.18.0.4 cluster-slave3 172.18.0.5 Docker 安装 curl ...

zhichangterry 2019-08-16 17:54 评论0 收藏0

发表评论

登陆后可评论

0条评论

Yu_Huang

男|高级讲师

我要关注我要私信

TA的文章

lenet

阅读 1933·2023-04-26 02:30
icejs 2.0 发布、Kraken 0.9.0 发布 | 淘系前端架构周刊 211108 期

阅读 1193·2021-11-10 11:36
DiyVM：十月特惠5折起，香港VPS/日本VPS/美国VPS，2G内存套餐月付50元起,CN2线路

阅读 1541·2021-10-08 10:14
七，FreeRTOS之——队列同步与互斥

阅读 3684·2021-09-28 09:35
pacificrack，便宜vps秋季促销，$18/年，2核/4G内存/50gSSD/5T流量/1G

阅读 1679·2021-08-23 09:47
解决html页面展开内容出现滚动条时抖动问题

阅读 2701·2019-08-30 15:56
前端面试每日 3+1 —— 第125天

阅读 1603·2019-08-30 15:44
使用自定义的鼠标图标 --- cursor url

阅读 1952·2019-08-30 13:59

资讯专栏INFORMATION COLUMN

上云采购季！| 2核2G4M爆款云服务器低至59元/年，更有多台、长期优惠，快来选购！

Docker搭建Hadoop集群

</>复制代码

</>复制代码

</>复制代码

</>复制代码

</>复制代码

</>复制代码

</>复制代码

</>复制代码

</>复制代码

</>复制代码

</>复制代码

</>复制代码

</>复制代码

</>复制代码

</>复制代码

</>复制代码

</>复制代码

</>复制代码

</>复制代码

</>复制代码

</>复制代码

相关文章

发表评论

0条评论

男|高级讲师

TA的文章

最新活动