Java配置
rpm -i jdk-7u67-linux-x64.rpm #安装Java7
vi + /etc/profile #配置环境变量
在文件末尾追加环境
export JAVA_HOME=/usr/java/jdk1.7.0_67
PATH=$PATH:$JAVA_HOME/bin
激活环境
source /etc/profile
ssh配置
检查ssh是否能免密登录本机
ssh localhost
配置秘钥
ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys
配置Hadoop
创建文件夹,解压文件
mkdir -p /opt/ran
tar xf hadoop-2.6.5.tar.gz -C /opt/ran/
配置激活Hadoop环境变量,
export HADOOP_HOME=/opt/ran/hadoop-2.6.5
PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
source /etc/profile
进入/opt/ran/hadoop.2.6.5/etc/hadoop修改配置文件
为避免找不到Java路径,进入hadoop-env.sh,mapred-env.sh,yarn-env.sh改为Java绝对路径
配置主节点文件信息core-site.xml,默认配置节点信息保存在了临时目录,为防止信息丢失,修改节点信息存在路径
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://node06:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/var/ran/hadoop/pseudo</value>
</property>
</configuration>
配置副本数,secondarynamenode,hdfs.site.xml
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.namenode.secondary.http-address</name>
<value>node06:50090</value>
</property>
</configuration>
配置datanode,vi slaves
格式化
格式化后,配置文件信息会保存在设定的路径
format过程中,在pseudo/dfs/name/current中会产生VERSION文件,其中包含集群的唯一ID,为集群中所有集群共享
注意格式化的次数,每次格式化,该结点的集群ID发生变化,其他结点ID没有变化,导致一些操作错误。慎重多次格式化!
hdfs namenode -format
启动集群
start-dfs.sh
关闭集群
stop-dfs.sh