hadoop 0.21.0 伪分布式环境搭建（mac雪豹系统）

yuhai.china

浏览: 153952 次
性别:
来自: 北京

最近访客更多访客>>

erpaoshouling

leiwuhenfan

clanmei

CURRY_LI

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

Hadoop SSH XSL Python XML

1.下载hadoop包，http://labs.renren.com/apache-mirror//hadoop/core/hadoop-0.21.0/hadoop-0.21.0.tar.gz
2.解压 tar xzf hadoop-0.21.0.tar.gz
3.进入hadoop解压后得文件夹，编辑hadoop-env.sh 指定JAVA_HOME变量，比如

export JAVA_HOME=/System/Library/Frameworks/JavaVM.framework/Versions/CurrentJDK/Home

4.edit ~/.bash_profile

export HADOOP_INSTALL=your hadoop directory
export HADOOP_HOME=your hadoop directory
export PATH=$PATH:$HADOOP_INSTALL/bin

5.重新开shell窗口，执行 hadoop version，可以看到如下信息

引用

Hadoop 0.21.0
Subversion https://svn.apache.org/repos/asf/hadoop/common/branches/branch-0.21 -r 985326
Compiled by tomwhite on Tue Aug 17 01:02:28 EDT 2010
From source with checksum a1aeb15b4854808d152989ba76f90fac

6 配置ssh，确保你的系统允许远程登录。执行以下命令，

引用

ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa
cat ~/.ssh/id_rsa.pub > ~/.ssh/authorized_keys

7 执行 ssh localhost，如果能不输入密码就可以登录就对了。
8 首次使用hadoop，需要格式化hdfs文件系统。请在hadoop的目录下新建一个logs目录，这个目录是默认用来放置log的地方。执行以下命令

引用

hadoop namenode -format

如果没有异常抛出，只有正常的log就对了

9开启守护进程进入hadoop目录的conf子目录，
(1)修改 core-site.xml

引用

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>



<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost</value>
</property>
</configuration>

（2）修改hdfs-site.xml

引用

?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>



<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>

(3) edit mapred-site.xml

引用

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>



<configuration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:8021</value>
</property>

</configuration>

(4)执行

引用

start-dfs.sh
start-mapred.sh

现在可以试用hadoop的威力了，如果不会用hadoop，这里有使用python的脚本方法
[url]
http://packages.python.org/mrjob/writing-and-running.html#running-on-your-own-hadoop-cluster
[/url]
只需要执行

引用

python your_mr_job_sub_class.py -r hadoop < input > output

非常方便

10 停止守护进程

引用

stop-dfs.sh
stop-mapred.sh

最后强烈推荐这本书，http://product.china-pub.com/196200&ref=browse

分享到：

Recommender system based on hadoop | php使用xpath抽取网页超链接

2011-04-09 13:31
浏览 1994
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论