迷惑メールフィルターはいかにして迷惑メールを判定し、なぜブロックしきれないのか

2024.06.162025.02.26

迷惑メールフィルターは、様々な手法を組み合わせて迷惑メールを判定します。
しかし、どうしても見逃しや隔離しすぎの判定ミスがあります。

これは、プログラムは個人の価値判断を完璧には代行できないことが本質的な原因です。

迷惑メールフィルターはいかにして迷惑メールを判定し、なぜブロックしきれないのか

AIに「丸投げ」したらいいのに。

迷惑メールフィルターはいかにして迷惑メールを判定し、なぜブロックしきれないのか

自動車の自動運転のように、人間を「補助」するのが主な役割なんだね。

仕事の迷惑メール対策をした（二要素認証とスパムフィルター）

仕事の迷惑メール対策をした（二要素認証とスパムフィルター）

迷惑メールが増加し、不正アクセスのリスクが高まっています。2要素認証の設定とアカウント登録用メールアドレスの分離が、パスワード漏洩の被害を防ぐ有効な対策です。迷惑メールフィルターの強化とメールクライアントの設定変更、セキュリティソフトの導入、利用者教育が、迷惑メール対策に役立ちます。迷惑メールの増加とリスク対策いったん不正アクセスの侵入を許してしまうと大きな被害になります。金銭的な被害だけでなく、重要なデータにアクセスできなくなると多くの人に迷惑をかけてしまいます。フィッシン...

迷惑メールフィルターはいかにして迷惑メールを判定し、なぜブロックしきれないのか

YouTube動画でも話しています。

1. 代表的な迷惑メールの判定方法と限界

たくさん届く迷惑メールをすべて目を通して判断するのは大変。

そこで、メールシステムには迷惑メールを自動判定する仕組みが用意されています。
「迷惑メールフィルター」です。

迷惑メールの判定方法

ブラックリストとホワイトリスト
ルールベースのフィルタリング
機械学習（ベイジアンフィルタなど）

参照：なぜか auメールで受信できない相手がいる？【メールサーバーのフィルタリング】

目次に戻る

1.1. リスト管理（ブラックリスト）

迷惑メール送信元やドメインが既にわかっていれば、ブラックリストに登録しブロックします。
一方、信頼できる送信元をホワイトリストに登録し、確実に受信できるようにします¹。

ただし、

リストの管理が必要であり、新しい送信元への対応が遅れる可能性があります。

目次に戻る

1.2. ルールベースの判定

特定のキーワード、パターン、送信元IPアドレスなどのルールに基づいて判定します。

しかし、

ルールを定期的に更新しないと、新しい種類の迷惑メールに対応できません。

目次に戻る

1.3. 機械学習による判定

過去の迷惑メールと非迷惑メールのデータから学習し、統計的に判定します。
メールの内容を分析し、迷惑メールでよく使われるパターンを検出します。

機械学習の基本的な仕組み – スマホ教室ちいラボ

例えば、不自然な文面、過剰なHTMLタグ、不適切な画像などが該当します。
ユーザーごとに学習データを保持でき、新しい迷惑メールの傾向に自動的に適応できます。

ただし、

巧妙に偽装された迷惑メールを見抜くのは難しい場合があります。
学習データが不十分だと誤判定が増える可能性があります。

迷惑メールの検出精度（体感）

ウェブメール
（Gmail、iCloudメール、
　Outlookメール、Yahooメールなど）
キャリアメール
（docomo、au、Softbankなど）
プロバイダメール
（主にパソコン向けメール）

メールサービスによって、迷惑メールの検出精度が違う

ベイジアンフィルタとは？（ベイズの定理とスパム判定）

ベイジアンフィルタとは？（ベイズの定理とスパム判定）

「ベイジアンフィルタ」は、条件付き確率の考え方（ベイズの定理）をもとに迷惑メールである確率を計算する、古典的な手法です。過去のスパムメールと非スパムメールから単語の出現頻度の違いを学習して、新しく受信メール内の単語の組み合わせからスパム確率を計算するのが特徴です。ただし、判断材料が単語の出現頻度に依存しているため、正しいメールに似せた文章だとスパムと見分けられないことがあります。たとえば、「高額なプレゼントに当選しました！」などのような、独特のスパムメールには有効です。ベイジ...

目次に戻る

2. そもそも迷惑メールには「ゆらぎ」がある（グレーゾーン）

しかし、迷惑メールフィルターを有効にしても、受信箱に届く迷惑メールを「根絶」することはできません。
また、必要な予約確認のメールなどが「迷惑メール」フォルダに入ってしまうこともあります。

これは、本質的には、人間と自動判定プログラムには「ずれ」があるからです。

迷惑メールを判定できない理由

迷惑メールの手口が常に進化している
正規のメールと迷惑メールの境界が曖昧
日本語や文化への対応

迷惑メールの送信者は人間です。
フィルターを回避するために様々な手口を考案します。
例えば、テキストの一部を画像化する、ランダムな文字列を挿入するなどの手法があります。
特に、新種の迷惑メールは、フィルターのルールや学習データに含まれていないため、検出が難しい場合があります。
メールの受信者も人間です。
ニュースレターや広告メールなど、受信者によって必要かどうかの判断が分かれるメールもあります。
同じメールでも、ある人にとっては有用な情報で、別の人にとっては迷惑メールと感じることがあります。
あまりフィルターの感度を厳しくし過ぎると、必要なメールまで迷惑メールと誤判定される可能性が増えてしまいます。
フィルターは主に英語で開発されることが多いです。
ため、他の言語や文化圏特有の迷惑メールに対応しきれない可能性があります。

これらの理由から、迷惑メールフィルターは完璧ではありません。

2. そもそも迷惑メールには「ゆらぎ」がある（グレーゾーン）

ただ、適切に設定すれば、迷惑メールの大部分を防ぐことができます。
また、ユーザー自身が迷惑メールの可能性があるメールを慎重に扱うことも重要です。

仕事の迷惑メール対策をした（二要素認証とスパムフィルター）

仕事の迷惑メール対策をした（二要素認証とスパムフィルター）

迷惑メールが増加し、不正アクセスのリスクが高まっています。2要素認証の設定とアカウント登録用メールアドレスの分離が、パスワード漏洩の被害を防ぐ有効な対策です。迷惑メールフィルターの強化とメールクライアントの設定変更、セキュリティソフトの導入、利用者教育が、迷惑メール対策に役立ちます。迷惑メールの増加とリスク対策いったん不正アクセスの侵入を許してしまうと大きな被害になります。金銭的な被害だけでなく、重要なデータにアクセスできなくなると多くの人に迷惑をかけてしまいます。フィッシン...

こちらもどうぞ。

cPanelの迷惑メールフィルターを強化した（Apache SpamAssassin）

cPanelの迷惑メールフィルターを強化した（Apache SpamAssassin）

仕事用のメールアドレスに届く迷惑メールが、うまく振り分けられていないことに気づいたので、メールサーバーの設定を変更することにしました。cPanelのスパムフィルタ私が使用しているレンタルサーバーでは、「cPanel」の管理メニューから「スパムフィルタ」が設定できました。このスパムフィルタは、「Apache SpamAssassin」が搭載されていました。スパム閾値スコアを下げる関係するのは、「スパム閾値スコア（Spam Threshold Score）」。この値を調整すると、...

Gmailへメールを送るための新ルール（送信側からのスパム対策）

Gmailへメールを送るための新ルール（送信側からのスパム対策）

2024年2月より、Gmail宛ての大量メール送信者に適用される新しいガイドラインが施行されます。これらの変更は、迷惑メールと不正なメッセージの増加に対処するために設けられました。以前、Googleは検索に表示するには、HTTPSに対応するように要求したことがありました。今回は、そのメール版ということですね。これで、一気にメールのセキュリティ保護が進むね。Gmailにメールを送るには？7項目Gmailの新しいポリシー応は、迷惑メールを減らし、より安全でスパムのないコミュニケ...

いつの間にかセキュリティソフトの迷惑メール対策機能がなくなっていた【POPとIMAP】

いつの間にかセキュリティソフトの迷惑メール対策機能がなくなっていた【POPとIMAP】

マカフィーのセキュリティソフト（マカフィーリブセーフ）で、迷惑メール対策の設定をしようとしたら、項目が見つからなくてびっくりしました。2021年に迷惑メール機能が廃止されていたようです。前と同じ感覚でいるとダメだね💦今のセキュリティソフトは迷惑メール対策には、役に立たないの？一応、詐欺サイトの警告とか、ちょっとは関係あります。迷惑メールフィルターの「関門」「迷惑メール」をチェックする場所は、▶ セキュリティソフトと▶ メールサーバのサービスの二通りあります。以前は、パソコン...

なぜか auメールで受信できない相手がいる？【メールサーバーのフィルタリング】

なぜか auメールで受信できない相手がいる？【メールサーバーのフィルタリング】

友達からメールを送ってもらっても届かないことがあるんだよね。こっちから送ったメールは、相手に届くんだけど……携帯電話のメールを使っていると、「受信できない」というケースがあります。「アドレス不明」の原因と、迷惑メールフィルターの仕組みを見ていきます。アドレス不明が返ってくる主な理由送信先のメールアドレスを入力し間違えた相手のメールアドレスがすでに解約されている相手のフィルタリング規制に引っかかっている相手に届いたメールは「アドレス不明」試しにメールを送ってみましょう。すると、...

（補足）

近年は、「ブラックリスト」「ホワイトリスト」という表現について、色に善悪概念を持ち込むことは不適切だ、とする意見もあるようです。｢ブラックリスト｣や｢ダミー｣はNGワードなのか英語圏で進む｢インクルージョン｣な表現とは | 気になる英語気になる日本語 | 東洋経済オンライン（2021/04/13）それに対しては異論もあります – Blacklistは差別用語ではない #GitHub – Qiita （2020年07月30日）

目次に戻る

QRコードを読み込むと、関連記事を確認できます。

迷惑メールフィルターはいかにして迷惑メールを判定し、なぜブロックしきれないのか

タイトルとURLをコピーしました