Hadoopインストールメモ
Javaのインストール
http://java.sun.com/javase/downloads/index.jspで、
「Java SE Development Kit (JDK) 6 Update 10」をダウンロードリンクを辿る。
「j2sdk-1_4_2_18-linux-i586-rpm.bin」をダウンロード。
以下のようにコマンドを打ってインストール。
$ chmod +x j2sdk-1_4_2_18-linux-i586-rpm.bin
$ su
# rpm -ivh j2sdk-1_4_2_18-linux-i586.rpm
Hadoopのインストール
http://hadoop.apache.org/core/releases.html#Download
上記のURLからHadoopをダウンロード。
ファイル名は「hadoop-[VERSION].tar.gz」。
今回、ダウンロードしたのは「hadoop-0.17.2.1.tar.gz」。
その後、解凍して、ディレクトリ名を「Hadoop」変更。
$ tar -xvzf hadoop-0.17.2.1.tar.gz
$ mv hadoop-0.17.2.1 hadoop
Hadoopの設定
次に「[HADOOP INSTALL]/conf/hadoop-env.sh」を編集する。
JAVA_HOME環境変数設定する。上記の方法でインストールした場合、
「/usr/java/jdk1.6.0_10」
と設定。
次に「[HADOOP INSTALL]/conf/hadoop-site.xml」を編集する。(ファイルがなければ、hadoop-default.xmlをコピーしてくる)。
下記のように変更した。
hadoop.tmp.dir
/tmp/hadoop-${user.name}
fs.default.name
hdfs://localhost:54310
mapred.job.tracker
localhost:54311
dfs.replication
1
Hadoopのフォーマット、起動、停止
以下のコマンドでフォーマットと起動と停止を行なえる。
$ cd hadoop
$ ./bin/hadoop namenode -format # フォーマット
$ ./bin/start-all.sh # 起動
$ ./bin/stop-all.sh # 停止
参考サイト
- Hadoopのインストールとサンプルプログラムの実行:CodeZine(http://codezine.jp/article/detail/2485)