Naive Bayes

Naive Bayesを知らない人へ 
=> Spam処理なんかで有名です。おかしな単語(出会いとか?)を検知してメールを正しく分類する統計的なアルゴリズムです。

この辺を参考にNaive Bayesを実装してみた。
といってもそんなに難しいものではなく、コア部分だけなら1時間ぐらいで実装はできた。
Bag-of-Wordなのだけれども、素性名を変わりに入れることで柔軟に対応できるはず。
クラス数は任意。Laplace Smoothingを利用してdeltaの値は調整可能とした。
(それよりも、交差検定なんかやオプション指定なんかの方がよっぽど面倒・・・)

実際にやってみると結構面白い。Spam処理なんかはなるほど、これで十分可能である気がしてくる。
できればEMアルゴリズムも追加して実装してみたいのだけれども、その他にやることたくさんあるしなぁ・・・。