勝手に録音がぬあんと15.8%。Googleアシスタント録音リークでGoogleカンカン

  • 29,839

  • X
  • Facebook
  • LINE
  • はてな
  • クリップボードにコピー
  • ×
勝手に録音がぬあんと15.8%。Googleアシスタント録音リークでGoogleカンカン
Image: Gizmodo US

勝手に起動することで知られる音声コマンドのGoogleアシスタントとGoogle Homeが、な~んと勝手に録音までしていて、しかもその一部は人間が聞いていたことがわかりました!

集音の録音をチェックする業務の契約スタッフが、1,000件を超える録音をベルギーの報道機関VRT Newsにリークして明らかになりました。 動画で公開された録音は青ざめます。いやだって、ほんとに録音の生の声が聞けるんだもん、びっくりですわ。

Google(グーグル)が人間を雇って録音を文字に起こさせて、それで性能向上に役立てているというのは、知識としては知っていました(AmazonもAppleもみな認めている。人力で確認しないとダメだという、音声アシスタントの技術的な限界については既報の事実)。でもこんなふうに大量リークできる、というのは新しいですね。文字でわかったつもりになっていても、声のインパクトは想像以上だった…。

リークしたのは下請けの新規契約社員とのことです。録音の確認作業で普段使っているソフトまで記者に見せて分析を依頼しています。スマスピやスマホの音声アシスタントの声は録音され、保存され、ハッカーや政府にリークされるリスクは不可避的にあって、時と場合によってはベルギーの報道デスクの手に渡ることもある、という認識ですね。

190717Google_software
Image: VRT News
音声解析中

怒るGoogle

もちろんGoogleはカンカンです。音声の確認作業は多言語対応には欠かせないプロセスだと説明し、深刻な機密守秘義務違反であると公式ブログで憤りを表明しました。まあ、人力の音声確認作業は英語でもやってますけどね。苦り切ったトーンで次のように書いています。

多言語対応の確認作業の担当者1名が、データ保護方針を破り、社外秘のオランダ語の音声データを漏えいする事案が発生し、現在社内のセキュリティおよびプライバシーの対策チームが確認を急いでいます。原因を調査のうえ、適宜対応し、今後このような事態が二度と起こらぬよう、当該分野のデータ保持の流れについて徹底的に見直していきます。


弊社は確認作業全般を通して、幅広いプライバシー保護対策を施しています。言語スペシャリストによる人力の確認作業に回るのは、全音声録音スニペットのうちわずか0.2%です。

へ~それっぽちなんだね!と一瞬思ったけど、よく考えてみたらGoogleアシスタントが聞き耳を立てているデバイスは全地球に10億台。0.2%といっても途方もない数なのでした…。

勝手に起動マン

何よりも今回の騒ぎで、ええっ!?!…となったのは、持ち主が呼びつけたわけでもないのに勝手に起動して録音されているケースが想像以上に多いことです。

公式ブログの説明にもあるように、音声コマンドの端末は、「Hey Google」とか「OK Google」とか、開けゴマ的な起動コマンドで呼ばない限り、起きないことになっています。ところが…

VRT News編集部が1,000件余りの録音を聞いてみた結果、153件は本来録音されるはずのない会話とわかった。つまり音声中ただの一度も「OK Google」というコマンドが明瞭には聞き取れないのだ。

録音の15.3%はGoogleが本来録音するはずのない録音、という計算です。うざ過ぎてOFFにしている人は納得なのでは。これについてGoogleは「背景音が紛らわしくて誤認するケースが稀にある」と公式ブログで書いています。稀って15.3%ですよ。全然、稀な気がしないんですけど!

背景音が紛らわしいと言う前にその紛らわしい音声コマンドをなんとかすべき

Googleはそもそも「OK Google」とか「Hey Google」という音声コマンドが異様に紛らわしいんですよ。どっちも普通に会話に出てくる単語じゃないですかね。OK、Heyなんて朝から晩まで使う言葉だし、Googleを話題することも多いし…。わざと誤認増やしてんの?誤起動マンのフリした盗聴マン?って勘ぐっちゃいますよお。

Alexaだって、家にAlexが遊びにくると起動しっぱなしですからねぇ…まあ、あれは笑えるんだけども。GoogleはGoogleという単語が想像以上に汎用名詞および動詞化している事実に目を覚まし、いっそ「つちのこ」とか「やっこさん」とか、絶対会話に出てこない単語に変えるべきなんですよ。なぜそれができない。

いつ呼び出されても起動できるように、常に聞き耳を立てているのはわかるんですけど、無断で録音するのは技術的にどうあれ、法的にはアウトな領域です。Google HomeもAmazon EchoもAppleのHomePodも本質的に盗聴器と変わるところはない、と言っちゃってるプライバシーの専門家もいて、最初は???と思ったけど、技術的な内情が明らかになるにつれ、あの譬えは正しかったのかも、という思いは強まるばかりなり…。

集音の実態

そんなわけで、ベルギー大量リーク。要点を整理しますと…

・Google Homeにはマイクが入っていて、デフォルトでONになっている。

・その集音マイクで、持ち主の同意なしに勝手に録音していることも15%ほどある。

・録音の0.2%は下請けの契約スタッフのテープ起こしに回る。

・こんな時給じゃやってらんねえわと思ったか、彼女にふられてムサクサしたか、俺が聞いてるの知ってんのこの人?と義侠心に駆られたか、動機は不明ですが、録音は人間臭い思いを抱える人間の手に渡り、何かの弾みにマスコミに流れることもある。

いやあ、Google Home、Amazon Echo、HomePodを海に捨てて、「こんな未来は真っ平だ!」と空に向かって叫んで砂浜に崩折れますかね。それができないなら、マイクの回りでは妙なこと口走らないようにせいぜい気をつけましょう。

Source: VRT News