ベイジアンフィルタ

ベイジアンフィルタとは?(ベイズの定理とスパム判定) とりあえずのメモ

ベイジアンフィルタとは?(ベイズの定理とスパム判定)

「ベイジアンフィルタ」は、条件付き確率の考え方(ベイズの定理)をもとに迷惑メールである確率を計算する、古典的な手法です。 過去のスパムメールと非スパムメールから単語の出現頻度の違いを学習して、新しく受信メール内の単語の組み合わせからスパム確率を計算するのが特徴です。 ただし、判断材料が単語の出現頻度に依存しているため、正しいメールに似せた文章だとスパムと見分けられないことがあります。 たとえば、「高額なプレゼントに当選しました!」などのような、独特のスパムメールには有効です。...
迷惑メールフィルターはいかにして迷惑メールを判定し、なぜブロックしきれないのか インターネット小話

迷惑メールフィルターはいかにして迷惑メールを判定し、なぜブロックしきれないのか

迷惑メールフィルターは、様々な手法を組み合わせて迷惑メールを判定します。しかし、どうしても見逃しや隔離しすぎの判定ミスがあります。 これは、プログラムは個人の価値判断を完璧には代行できないことが本質的な原因です。 AIに「丸投げ」したらいいのに。 自動車の自動運転のように、人間を「補助」するのが主な役割なんだね。 YouTube動画でも話しています。 代表的な迷惑メールの判定方法と限界 たくさん届く迷惑メールをすべて目を通して判断するのは大変。 そこで、メールシステムには迷惑...
cPanelの迷惑メールフィルターを強化した(Apache SpamAssassin) とりあえずのメモ

cPanelの迷惑メールフィルターを強化した(Apache SpamAssassin)

仕事用のメールアドレスに届く迷惑メールが、うまく振り分けられていないことに気づいたので、メールサーバーの設定を変更することにしました。 cPanelのスパムフィルタ 私が使用しているレンタルサーバーでは、「cPanel」の管理メニューから「スパムフィルタ」が設定できました。 このスパムフィルタは、「Apache SpamAssassin」が搭載されていました。 スパム閾値スコアを下げる 関係するのは、「スパム閾値スコア(Spam Threshold Score)」。この値を調...