mechanizeでページタイトル取得

mechanizeかわいいよmechanize
[ruby]
require ‘rubygems’
require ‘mechanize’

def get_page_title(url)
agent = WWW::Mechanize.new
page = agent.get(url)
return page.title
end
puts get_page_title(‘http://mail.google.com/mail/’)
[/ruby]

これまでhpricotを使ってページタイトルの取得をしていましたが、問題にぶち当たりました
上記スクリプトのように、(ログアウト状態で)アクセスするhttpからhttpsへリダイレクトされる場合、なぜかhpricotでは失敗してしまうのです
しかし、mechanizeでは普通にタイトルを取得してくれました!
これからはmechanizeを勉強してみようと思います

カテゴリー: All   タグ: ,   この投稿のパーマリンク

コメントをどうぞ

メールアドレスが公開されることはありません。

次のHTML タグと属性が使えます: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>