2008-01-01から1年間の記事一覧
GETだとAPI制限になることが判明したのでuserscripts.orgから引き上げたけど、とりあえずソースだけ貼っとく。いつものようにPOSTでAPI制限は無視できるので、使いたい人はそこいじって使えばいいとおもいます。もうPOSTでAPI制限は無視できなくなったので使…
他消火が伊露露モナコMeCab55二時へホンがツクる ピャじゃなかった!なおした ニーズ "ヨッピーさんがしゃべってる言葉の変換系はまだできないんですか" "youpyさんのtwitterをフィードで読んでイラッとして自動翻訳書いてたけど10分ぐらいでアホかと思っ…
twitterにもかいたけど。 http://fuba.jottit.com/exthtml
jottitのほうに公式ページをつくりました。値がとれるだけでは退屈、ページ辿りたいし、その先も辿りたいので機能追加。ずいぶんたくましくなりました。あとはキャッシュができればいいですねー。 追加したオプション n 次のページ(別に次じゃなくてもいい…
jottitのほうに公式ページをつくりました。画像一覧からXPathでぶっこぬいてダウンローダにわたす、といった用途から簡単なマイニングまでべんりにつかう予定。 つかいかた % ./exthtml.pl [ -a [AGENT] -e [REFERER] -c [COOKIE_JAR] ] -x [XPATH] [URL] % …
lib/Plagger/Plugin/Filter/EntryFullText/LDRFullFeed.pm http://b.hatena.ne.jp/otsune/20080530#bookmark-8776502 SITEINFOはwedata版に書き換えたほうがよさそう とのことなので書き換えた。HTML::Featureを使ってもっと便利にしたかったのだけど、UAが…
# upgrade http://pixiv.net/ author: fuba custom_feed_handle: http://www\.pixiv\.net/ custom_feed_follow_link: member_illust\.php\? handle: http://www\.pixiv\.net/member_illust\.php\? extract_xpath: body: //div[@id="content2"] author: //div…
LDR Full FeedのSITEINFOがWedataに移動して便利になったので、そろそろHTML::Featureのエンジンが必要だと思って書いてみた。HTML::FeatureについてはHTML::Feature - 重要部分を抽出するモジュール - - download_takeshi’s diaryを、エンジンの拡張につい…
ランダムな転送という実装は、つまり十分な回数のアクセスを奨励している。とりあえず1001回の連続アクセスを試みる。 $ perl -MYAML::Syck -e 'my %urls;for my $i (0..1000) {if (`curl -l http://firefox.jp/`=~/src\=\"([^\"]+)\"/) {sleep 1; $urls{$1}…
LDRでgを押せば全文出てくるべんりなLDR Full Feedだけど、個人的には自作の自動抽出のをつかってるのでいいなーと思いながら指をくわえてその進化を見つめています。ただ本文XPathのsiteinfoはものすごく使えそうなので、とりあえず試しにPlaggerでただのり…
不評だったのでぐりもんにしました。入れるとふぁぼりページの左上にリンクがでるので、それクリックするとvisualize twitterersみたいに表示します。ダブルクリックでもどります。 http://userscripts.org/scripts/show/20789 greasemonkeyにするのもめんど…