匿名化データなんか集めて、なにやってるの?

  • 7,913

  • author Shoshana Wodinsky - Gizmodo US
  • [原文]
  • 湯木進悟
  • X
  • Facebook
  • LINE
  • はてな
  • クリップボードにコピー
  • ×
匿名化データなんか集めて、なにやってるの?
Photo: Getty

安心感を抱かせつつ?

個人情報を勝手に収集されてうれしい人なんて、どこにもいないことでしょう。でも、その情報を匿名化して、個人が特定されないように収集しますといわれたら? なんとなく安全なように感じませんか? それならば協力してもいいのかなって…。

匿名データでも個人情報に紐付けられちゃう

ところが、このほどハーバード大学の2人の学生が、インターネット上に流出した匿名データを収集分析可能なツールを開発。いろいろ大手企業などが、ユーザー情報などの流出を謝罪するニュースって、北米でも相次いできたのですが、そのいわゆる匿名化されたデータの数々は、簡単にユーザーネームやメールアドレスに紐づけして、個人の特定へ大きく近づけてしまうことが明らかにされていますよ!

匿名データでも十分ですけど...

ちなみに、今回の分析結果から考えられるのは、そもそも企業は、ユーザーからデータを集めて、別に個人なんて特定せずとも莫大な利益を上げていることです。たとえば、わかりやすい例としまして、ここにペットショップと花屋さんとゲイバーで支払いをしたレシートがあるとしましょう。そうすると、この情報から企業がほしいのは、ペットと植物とLGBTについての広告ターゲットがいるということだけです。別にそのレシートの持ち主の名前も年齢も職業も家族構成も必要ありません。ターゲットにあった広告さえ見せられれば、あとはその相手がどうであろうとよいのですから。

あるいは、もっと漠然としたデータ収集であってもよいようです。つまり、とあるサービスを使っている人は、全体的にどういう年齢層や性別で、どのあたりに住んでいて、どういうものに興味を持っているか? わざわざ個人を特定せずとも、全体として、どんなユーザー層が多いのかさえ判明すれば、もうそれだけで、かなりターゲットを絞った広告を配信したり、営業をかけたりできてしまうんですからね。

こうやって考えるならば、どんなに収集データが、プライベートな個人から切り離されていても、分析する側には多大のメリットがあり、基本的に匿名化したデータで十分ではあるわけです。でも、もしも流出して悪用されたら? 意外と個人をも特定できる仕方で集められている莫大なデータが、ブローカーから悪意ある人物組織の手に渡ったり、挙句の果てに広告以外有害な目的で使われてしまったら? その可能性は無限大でもあるでしょう。

そう思うと、匿名化して集めるからといって、ユーザー情報の収集に協力してよいものか、非複雑なところでもありますよね。