#contents

*スクレイピングとは [#w02aa676]
htmlをプログラムで解析することをスクレイピングと呼ぶらしい


rubyではHpricotが有名
rubyではHpricotが有名で、HTMLをJQueryみたいに要素を検索してまとめて配列にしてくれたりするライブラリーがあります。

*Hpricotインストール [#rb3f8375]
 sudo gem update --system
 sudo gem install hpricot
 
http://tam.qmix.org/wiki/Hpricot.html

*くせがある [#bc812692]
*Hpricotの注意点 [#bc812692]
インストール後は次のように使う、ちょっとくせがあるので、発見したことを説明

**ネット越しに呼びたい場合 [#c133cd99]
  require 'open-air'
が必要です。

**単体では使えません。 [#j98ecf79]
 require 'rubygems'
 require 'hpricot'

セットで必要です。

***サンプルコード [#yd6d5a2c]
 require 'rubygems'
 require 'hpricot'
 require 'open-uri'

 
 url="http://route477.net/d/?date=20070205"
 Hpricot( open(url).read )

トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS