ベイジアンフィルタ万歳

そう言えば http://d.hatena.ne.jp/rerasiu/20041001/p4 で紹介したpopfile(http://popfile.sourceforge.net/cgi-bin/wiki.pl?JP_POPFileDocumentationProject)の使用感を報告すると言っておきながらしていなかったのでこれからします。
このpopfileというのはベイジアンフィルタによってspamメールとそうでないメールを判別し、振り分け処理を行うソフトウェアです。
ベイジアンフィルタというのはベイズ理論を用いたフィルタリングのことで……まあ簡単に言えば以前のデータを元に判断を行うフィルタリング方式のことです。つまり、受信したメールに対してこれはspam、これはspamではない、ということを指示してあげると、その蓄積が増えれば増えるほど正しい判断を行えるようになるフィルタリング方式ということです。
で、このpopfileに対して私は導入日に、それまで自分に到着していたspamをそのまま自分に30通ほど送りつけてそれらは全部spamだぞと指示したところ、それだけでもう随分と多くのspamを隔離できるようになりました。かなり優秀ですよ。これまで96.77%の確率でspamとそうでないメールの判別ができております。
ただ最近はちょっと教育の方をサボっておりまして、はてなから来るお知らせメールが結構な確率でspamとして処理されるようになってきてしまいました! 一体何故!