perlでHTMLパース

HTMLからデータを抜き出すhtml Parse perl版モジュール

HTML::TreeBuilder(::XPath)

WWW::Mechanize

HTML5