2009年11月17日火曜日

Hive楽だわ~

MapReduce用のテストデータを実データから抽出しようとしているのですが、Windows環境に持ってきて秀丸でgrepとかやってると、PC全体が重くなって使い物になりません。
ちょうどテスト環境に実験的にHiveを入れて、実験データにテストの実データを入れていたので、それを試しに使ってみた。
検索結果の件数が少ない条件を抽出したいな~なんて時は、何度も検索を実行する訳なんですが、CD-ROM一枚分くらいのデータを1分~2分足らずで抽出してくれるので楽です。(VMWare4台構成)
お試しあれ

2009年11月14日土曜日

Hadoop The Definitive Guide の邦訳版

昨日のHadoop カンファレンス Japan 2009の懇親会中
「『Hadoop The Definitive Guide』の邦訳が1月に出ます!」
というアナウンスがありました!

ようやく日本語のアナログ情報がでる~♪

Hadoop カンファレンス Japan 2009

こんにちは。yoshitsuguです。

昨日、HadoopカンファレンスJapan 2009に参加してきました。

ちょっとレポートできるほど時間の余裕がないのですが、Hadoopが、今、米国ですごくホットな技術であり、日本でもだいぶホットになってきたんだというのを実感できました。

だいたい、みなさん1年くらい前からテスト的に使い出し、今年に入って本格的に運用に持って行っている所という感じでした。

今、キャズムの一歩手前かな。キャズムを超えられるかはこれからのシステムの安定性・信頼性の確保にかかっていると思う。

詳しくはのちほど。

ではでは

2009年11月10日火曜日

SafeModeのちょいワザ

こんにちは、yoshitsuguです。

HDFS上のデータが壊れたりして、HDFSがSafeModeに入りっぱなしになり
困ったことはありませんか?
(Safe Modeだとファイルの追加・削除ができないうえ、fsck -deleteも使えません)

そんな時に一時的にSafe Modeを抜けるワザです。
(Hadoopのドキュメントに普通に書いてあるので裏技ではありません)


$HADOOP_HOME/bin/hadoop dfsadmin -safemode leave


SafeModeを抜ける必要のある作業が終わったら


$HADOOP_HOME/bin/hadoop dfsadmin -safemode enter


コマンドでSafeModeに戻すことも可能です。

※なお、-safemode enterは手動でSafeModeに入るため、SafeModeから抜けるためにはもう一度-safemode leaveコマンドを実行する必要があります。

参考資料:Apache Hadoop コマンドガイド(英語です)