Hadoop2.6.5伪分布式环境配置

Java配置

rpm -i jdk-7u67-linux-x64.rpm      #安装Java7
vi + /etc/profile                     #配置环境变量

在文件末尾追加环境

export JAVA_HOME=/usr/java/jdk1.7.0_67
PATH=$PATH:$JAVA_HOME/bin

激活环境

source /etc/profile

ssh配置

检查ssh是否能免密登录本机

ssh localhost

配置秘钥

ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

配置Hadoop

创建文件夹,解压文件

mkdir -p /opt/ran
tar xf hadoop-2.6.5.tar.gz -C /opt/ran/

配置激活Hadoop环境变量,

export HADOOP_HOME=/opt/ran/hadoop-2.6.5
PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
source /etc/profile

进入/opt/ran/hadoop.2.6.5/etc/hadoop修改配置文件
为避免找不到Java路径,进入hadoop-env.sh,mapred-env.sh,yarn-env.sh改为Java绝对路径
配置主节点文件信息core-site.xml,默认配置节点信息保存在了临时目录,为防止信息丢失,修改节点信息存在路径

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://node06:9000</value>
    </property>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/var/ran/hadoop/pseudo</value>
    </property>
</configuration>

配置副本数,secondarynamenode,hdfs.site.xml

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
        <name>dfs.namenode.secondary.http-address</name>
        <value>node06:50090</value>
    </property>
</configuration>

配置datanode,vi slaves

格式化

格式化后,配置文件信息会保存在设定的路径
format过程中,在pseudo/dfs/name/current中会产生VERSION文件,其中包含集群的唯一ID,为集群中所有集群共享
注意格式化的次数,每次格式化,该结点的集群ID发生变化,其他结点ID没有变化,导致一些操作错误。慎重多次格式化!

hdfs namenode -format

启动集群

start-dfs.sh

关闭集群

stop-dfs.sh
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容