搭建为伪分布式Hadoop环境

1、宿主机(Windows)与客户机(安装在虚拟机中的Linux)网络连接。

a) Host-only 宿主机与客户机单独组网;

好处:网络隔离;

坏处:虚拟机和其他服务器之间不能通讯;

b) Bridge 桥接 宿主机与客户机在同一个局域网中。

好处:窦在同一个局域网,可以互相访问;

坏处:不完全。

2、Hadoop的为分布式安装步骤

a) 设置静态IP

在centos下左面上右上角图标右键修改;

重启网卡service network restart;

验证:执行命令ifconfig

b) 修改主机名(原名称casichadoop)  hostname查看当前名称

修改当前会话主机名:设置名称 hostname hadoop

修改配置文件中:hostname vi /etc/sysconfig/network 为hadoop

c) 把hostname和ip绑定

执行命令 vi /etc/hosts增加10.10.10.10

保存退出

验证:ping hadoop

 

d) 关闭防火墙  先查看service iptables status

  Service  iptables stop

e) 防火墙自动启动 先查看chkconfig --list | grep iptables

关闭自动启动防火墙 chkconfig iptables off

    验证:chkconfig --list | grep iptables

 

f)  Ssh(secure shell)的免密码登录

         <1>执行命令shh-keygen -t rsa 产生秘钥,位于~/.ssh

         <2>执行命令cp ~/.ssh/id_rsa.pub ~/.ssh/authorized_keys

验证:ssh localhost

g)      安装JDK

 

l 打开目录 cd /usr/local 

l 然后删除全部文件rm -rf  * 

 

l 复制所有的文件到当前目录下cp /root/Downloads/* .

 

l 查看当前目录的权限 ls -l

l 赋予权限执行权限chmod u+x jdk-6u24-linux-i586.bin

 

l  执行安装JDK ./jdk-6u24-linux-i586.bin 

l  mv jdk1.6.0_24 jdk 重命名

l 设置环境变量vi /etc/profile 

n Export JAVA_HOME=/usr/local/jdk

n Export PATH=./$JAVA_HOME/bin:$PATH

n Source /etc/profile

n 验证:java -version

 

h)      安装HADOOP

i. Tar -zxvf hadoop-1.1.2.tar.zip

ii. Mv hadoop-1.1.2 hadoop

iii. 设置环境变量

n Export  HADOOP_HOME=/usr/local/hadoop

n Export PATH=.:$HADOOP_HOME/bin:$JAVA_HOME/bin:$PATH

iv. 修改四个配置文件

1. 修改hadoop-env.sh

 export JAVA_HOME=/usr/local/jdk

2. 修改core-site.xml

<?xml version="1.0"?><?xml-stylesheet type="text/xsl" href="configuration.xsl"?> <!-- Put site-specific property overrides in this file. --> <configuration><property><name>fs.default.name</name><value>hdfs://hadoop:9000</value><description>hadoop</description></property><property><name>hadoop.tmp.dir</name><value>/usr/local/hadoop/tmp</value></property></configuration>



3. 修改hdfs-site.xml

<?xml version="1.0"?><?xml-stylesheet type="text/xsl" href="configuration.xsl"?> <!-- Put site-specific property overrides in this file. --> <configuration><property><name>dfs.replication</name><value>1</value></property><property> <name>dfs.permissions</name><value>false</value></property></configuration>



4. 修改mapred-site.xml

<?xml version="1.0"?><?xml-stylesheet type="text/xsl" href="configuration.xsl"?> <!-- Put site-specific property overrides in this file. --> <configuration><property><name>mapred.job.tracker</name><value>hadoop:9001</value><description>change you own hostname</description></property></configuration>



 

v. 执行命令 hadoop namenoe -format 对hdfs格式化

vi. 执行命令 start-all.sh

vii. 执行命令 jps 查看进程

 

©著作权归作者所有:来自51CTO博客作者wx59c524c28c333的原创作品,如需转载,请注明出处,否则将追究法律责任

更多相关文章

  1. coe_xfr_sql_profile.sql和coe_load_sql_profile.sql
  2. Centos 7下安装pip(简略版)
  3. crmeb 多商户系统 首页精品推荐 推荐单品 首页新品 热门榜单顶部
  4. /etc/rc.local开机不执行解决
  5. 微信小程序服务类目在哪里可以修改?
  6. 浅谈Web安全常见问题
  7. SQL执行加载顺序
  8. Gitlab的介绍及使用
  9. 解决YUM下Loaded plugins: fastestmirror Determining fastest m

随机推荐

  1. Mybatis if, set, where 动态sql和sql片
  2. 99%的人都不知道的pandas骚操作(一)
  3. TensorFlow RNN Cell源码解析
  4. Requests库作者Kenneth Reitz的另一神作!
  5. TensorFlow Bi-LSTM实现文本分词
  6. JavaScript加密逻辑分析与Python模拟执行
  7. 关于互联网金融授信产品的风控建模
  8. 使用requests+正则表达式爬取猫眼电影排
  9. Learning to Rank概述
  10. 99%的人都不知道的pandas骚操作(二)