http://ja.wikipedia.org/wiki/Hadoop
巨大なファイルシステムってことで理解してていいんじゃないかな?
http://d.hatena.ne.jp/stanaka/20091125/1259124272
Map処理, シャッフル, Reduce処理の3つの手順から構成されている.
抽出する. 全てのMap処理は並列実行することができる.
Mapによって作られたデータを整理し, データを任意の順に並べ替える.
データをまとめて最終的に手に入れたい結果を作り上げるプロセスで, データ全体についての整理された処理結果を得る.