htmlをプログラムで解析することをスクレイピングと呼ぶらしい


rubyではHpricotが有名

*Hpricotインストール [#rb3f8375]
 sudo gem update --system
 sudo gem install hpricot
 
http://tam.qmix.org/wiki/Hpricot.html

*くせがある [#bc812692]
インストール後は次のように使う、ちょっとくせがあるので、発見したことを説明

**ネット越しに呼びたい場合 [#c133cd99]
  require 'open-air'
が必要です。

**単体では使えません。 [#j98ecf79]
 require 'rubygems'
 require 'hpricot'

セットで必要です。

***サンプルコード [#yd6d5a2c]
 require 'rubygems'
 require 'hpricot'
 require 'open-uri'

 
 url="http://route477.net/d/?date=20070205"
 Hpricot( open(url).read )


トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS