- 追加された行はこの色です。
- 削除された行はこの色です。
#contents
*スクレイピングとは [#w02aa676]
htmlをプログラムで解析することをスクレイピングと呼ぶらしい
rubyではHpricotが有名
rubyではHpricotが有名で、HTMLをJQueryみたいに要素を検索してまとめて配列にしてくれたりするライブラリーがあります。
*Hpricotインストール [#rb3f8375]
sudo gem update --system
sudo gem install hpricot
http://tam.qmix.org/wiki/Hpricot.html
*くせがある [#bc812692]
*Hpricotの注意点 [#bc812692]
インストール後は次のように使う、ちょっとくせがあるので、発見したことを説明
**ネット越しに呼びたい場合 [#c133cd99]
require 'open-air'
が必要です。
**単体では使えません。 [#j98ecf79]
require 'rubygems'
require 'hpricot'
セットで必要です。
***サンプルコード [#yd6d5a2c]
require 'rubygems'
require 'hpricot'
require 'open-uri'
url="http://route477.net/d/?date=20070205"
Hpricot( open(url).read )