mechanizeでページタイトル取得
January 22nd, 2009
No comments
mechanizeかわいいよmechanize
require 'rubygems'
require 'mechanize'
def get_page_title(url)
agent = WWW::Mechanize.new
page = agent.get(url)
return page.title
end
puts get_page_title('http://mail.google.com/mail/')
これまでhpricotを使ってページタイトルの取得をしていましたが、問題にぶち当たりました
上記スクリプトのように、(ログアウト状態で)アクセスするhttpからhttpsへリダイレクトされる場合、なぜかhpricotでは失敗してしまうのです
しかし、mechanizeでは普通にタイトルを取得してくれました!
これからはmechanizeを勉強してみようと思います