Heavy Moon

思いつ記

『#武雄市図書館 キッズライブラリのアンケートについて』 #武雄市問題 (前編)

武雄市が企画しているキッズライブラリの話について。

 

樋渡啓祐がこの件を言い出してからそれなりの時間が経ったわけだが、今回市民に向けてアンケートが発送されたようだ。

 

既にTwitterなどでは「なんじゃこりゃ」的な話題になっているが、調査票を入手したのでちょっとブログで触っておこうと思う。

 

[調査票表] [調査票裏]

 

先ずは前篇として、調査票の表(Q1~Q5)について書いてみよう。

 

個人情報について

Q1の設問は「保護者の年齢・性別」および「子供が通う学校名(実際にはそういう書き方をされていないが、母校ということはあるまい。こういう細かい部分にも調査票の設計の雑さが伺える)」

更に、「子供の性別・学年」を最大4人まで(ここがミソ)質問している。

 

既にTwitter上では市民の方を含め、以下のTweetが発信されている。

 

人口5万人の小さな街である。

その中でこれだけの情報をアンケートで聞けば個人の特定はさほど困難なものではない。

 

PDFデータ

 

ましてや、先に「ここがミソ」と書いたが小学生の子供が複数いる家庭であれば、更に特定は容易だろう。

さすがにちょっと調べられなかったが、もしかしたら武雄市には「小学生が4人いる家庭はあっても5人以上の家庭は無いのではないか?」という訝しい気分になる。

 

これは自治体のアンケートとしての負の側面というだけの話ではない。

ビッグデータ名寄せによる危険性も同時に示唆されている話なのだ。

わかりやすくアンケートの話を中心に展開すれば、「無記名アンケートは本当に無記名なのか?」という話である。

 

前述したように、アンケートでは属性の質問のように思える設問でも充分に個人を特定出来る可能性があるわけだ。

これは、武雄市に限らず小さな街に住まう人々は考えておかないといけないことなのだが、無記名アンケートが本当に無記名を実現するのは、アンケートの母体数が多い場合だけなのだ。

 

では、昨今「ビッグデータ」と呼ばれるものはどうかと考えてみよう。

 

実は考えるまでもない。

設問の中に属性として居住地があれば、たとえ何十万件・何百万件のデータであろうが、武雄市の中から小学生の子供のいる家庭を探すのと同じ結果になるのである。

 

大きなデータの中の一つだから・名前がわからないから(無記名だから)ということで、自分のデータをぼーっと渡すことが如何に危険であるかはきちんと考えないといけない。

 

追記:オマケとして以前に書いた無関係でもないまとめのリンクを貼っておく。

ある統計に関しての所感

 

その他、参考として。

武雄市図書館に関する統計データの考察

 


 

申し訳ない(;´Д`)

Q1~Q5と書いたが、長くなりそうなのでQ1に対しての言及のみで公開します。

次回以降はアンケートの内容そのものに触れていく予定です。

続編は明日にでも。

 

付記:というわけで、続編書いたよ。