mechanizeでページタイトル取得
1月 22nd, 2009
mechanizeかわいいよmechanize
RUBY:
-
require 'rubygems'
-
require 'mechanize'
-
-
def get_page_title(url)
-
agent = WWW::Mechanize.new
-
page = agent.get(url)
-
return page.title
-
end
-
puts get_page_title('http://mail.google.com/mail/')
これまでhpricotを使ってページタイトルの取得をしていましたが、問題にぶち当たりました
上記スクリプトのように、(ログアウト状態で)アクセスするhttpからhttpsへリダイレクトされる場合、なぜかhpricotでは失敗してしまうのです
しかし、mechanizeでは普通にタイトルを取得してくれました!
これからはmechanizeを勉強してみようと思います