2009年11月17日火曜日

Hive楽だわ~

MapReduce用のテストデータを実データから抽出しようとしているのですが、Windows環境に持ってきて秀丸でgrepとかやってると、PC全体が重くなって使い物になりません。
ちょうどテスト環境に実験的にHiveを入れて、実験データにテストの実データを入れていたので、それを試しに使ってみた。
検索結果の件数が少ない条件を抽出したいな~なんて時は、何度も検索を実行する訳なんですが、CD-ROM一枚分くらいのデータを1分~2分足らずで抽出してくれるので楽です。(VMWare4台構成)
お試しあれ

0 件のコメント:

コメントを投稿