「ディファレンシャル・プライバシー」は、利用者が送信する個人データの一部に、わざとランダムな情報を混ぜて、個人を特定できなくする方法です。それでも、ほとんどのデータは正しいので、集計して傾向を求めることができます。
1. データ解析とプライバシー

スマホの設定画面で「ディファレンシャルプライバシー」って言葉が出てきたんだけど、どんな意味なの?

データ分析の分野では、人々のプライバシーを侵害せずにデータを収集する方法として、「ディファレンシャル・プライバシー(differecntial privacy)」という仕組みを考えました。
この方法では、個人データを送信する前に、オリジナルのデータの一部にランダムなデータに加えます。それによって、データ全体としては厳密な正確さは失います。
しかし、この不正確なデータでも役に立ちます。集計すれば、概ね正しい傾向を知ることができるからです。


「〇〇さんが〜をした」というデータがあったとしても、真のデータなのか、ランダムデータなのか、区別できません。

「木を隠すなら森の中」かぁ。
ちょっとの「ウソ」を紛れ込ませることで、何が本当かわからなくできるのね。
「ディファレンシャル・プライバシー(differential privacy)」は、「差分プライバシー」とも訳されます。
「differential」という単語は、「違い(difference)」から派生した言葉で、数学では「微分」とも訳されます。
数学で、一度 微分した関数を、もう一度 積分しても、元の関数には戻らないことに、ちょっと似ているかもしれません。

QRコードを読み込むと、関連記事を確認できます。
