2008-04-01から1ヶ月間の記事一覧

HTML::Feature::Engine::LDRFullFeed - WedataにあるLDR Full FeedのSITEINFOを使ってWebページの本文を抽出するPerlモジュール

LDR Full FeedのSITEINFOがWedataに移動して便利になったので、そろそろHTML::Featureのエンジンが必要だと思って書いてみた。HTML::FeatureについてはHTML::Feature - 重要部分を抽出するモジュール - - download_takeshi’s diaryを、エンジンの拡張につい…

firefox.jpの転送先をしらべる

ランダムな転送という実装は、つまり十分な回数のアクセスを奨励している。とりあえず1001回の連続アクセスを試みる。 $ perl -MYAML::Syck -e 'my %urls;for my $i (0..1000) {if (`curl -l http://firefox.jp/`=~/src\=\"([^\"]+)\"/) {sleep 1; $urls{$1}…