一つ目は例のプロジェクト。これは無事立ち上がりました。大変好評で、新サーバに移行した甲斐があろうと言うものです。
二つ目にリクエストされていたのはタグクラウド。しかしブログパーツとして紹介されているものは 軒並み遅い 。 Wowzioとか良さげなのだが、時間帯によっては本気で死ぬほど遅い。
スクリプトの実装も多数あるのだが、タグクラウドというからにはタグ付けからスコアリングを行うわけで、特定のサービス(のタグ)に依存しているものが多い。そりゃそうだ。
ええ。
ぱぱネットは、nicky.cgiとtDiary混合サイトなので、ページをクロールするのはけっこう面倒くさい。共通のタグといっても厳しい。唯一共通の更新情報が得られるのはRSSくらいなものである訳で、これを元に作り始めたのだが RSSのテキストに強調タグがついてる訳がない(笑) 何のためのRSSなんだと・・・・
そこでやめればいいのに、Kakasiでわかち書きした単語を出現頻度と鮮度でスコアリングして・・・TFIDFの変形のようなことをしようとして・・・挫折しました(笑)