Hadoopインストールメモ

Javaのインストール

http://java.sun.com/javase/downloads/index.jspで、
Java SE Development Kit (JDK) 6 Update 10」をダウンロードリンクを辿る。
「j2sdk-1_4_2_18-linux-i586-rpm.bin」をダウンロード。
以下のようにコマンドを打ってインストール。

$ chmod +x j2sdk-1_4_2_18-linux-i586-rpm.bin
$ su
# rpm -ivh j2sdk-1_4_2_18-linux-i586.rpm

Hadoopのインストール

http://hadoop.apache.org/core/releases.html#Download
上記のURLからHadoopをダウンロード。
ファイル名は「hadoop-[VERSION].tar.gz」。
今回、ダウンロードしたのは「hadoop-0.17.2.1.tar.gz」。
その後、解凍して、ディレクトリ名を「Hadoop」変更。

$ tar -xvzf hadoop-0.17.2.1.tar.gz
$ mv hadoop-0.17.2.1 hadoop

 

Hadoopの設定

次に「[HADOOP INSTALL]/conf/hadoop-env.sh」を編集する。
JAVA_HOME環境変数設定する。上記の方法でインストールした場合、
「/usr/java/jdk1.6.0_10」
と設定。
 
 
次に「[HADOOP INSTALL]/conf/hadoop-site.xml」を編集する。(ファイルがなければ、hadoop-default.xmlをコピーしてくる)。
下記のように変更した。


hadoop.tmp.dir
/tmp/hadoop-${user.name}


fs.default.name
hdfs://localhost:54310


mapred.job.tracker
localhost:54311


dfs.replication
1

Hadoopのフォーマット、起動、停止

以下のコマンドでフォーマットと起動と停止を行なえる。

$ cd hadoop
$ ./bin/hadoop namenode -format # フォーマット
$ ./bin/start-all.sh # 起動
$ ./bin/stop-all.sh # 停止

参考サイト