トップページ > コラム

日本人はつぶやくのがお好き


2017.05.28


イメージ写真

 大学の私のゼミのテーマのひとつに、ツイッターやフェイスブックなどのSNSのデータを一定期間集めて、ビッグデータとして分析するというものがある。データの収集にはmentionという海外のサービスをフリーの期間(2週間)だけ使う。このサービスでは、単語を複数指定して、それらの単語がANDやOR条件で含まれる文章を収集してくれる。ニュース性の高い話題の単語を選ぶと、1週間で数万件のデータが集まる。

 今年のゼミ生にこのサービスを使ってデータ収集をさせる時期が来た。これまでは、私が口頭でやり方を教えながらデータ収集をさせていたが、今年は自分でできるようにマニュアルを作ることにした。フリーのサービスは予告なく仕様が変わったり、データのコードがJISからUnicodeに変わったり、日本語入力機能がおかしくなったりする。そこで、自分で実際にデータの収集を行う経過のスクリーン・ショットを取り、それを貼り付けたマニュアルにすることにしたのである。

 ゴールデンウィーク中であったので、車で移動する人達が渋滞に巻き込まれる事態が多発するに違いない。データも集まるのではないか、と予測し、「高速道路」「渋滞」「道の駅」「観光地」「国道」の5単語のいずれかを含むSNSデータの収集を開始した。5月1日の月曜日(カレンダーでは休みではない)の夕方からデータを取り始めたのだが、最初は全く集まらなかった。2日になっても集まり方は少ない。せいぜい千件である。これではビッグデータの分析にはならない。3日は大学が休みだったので、自宅でPCを開き状況を調べてみた。午前中からぐんぐんと集まり始めた。殆どすべてがツイッターである。「渋滞に巻き込まれた」「○○が渋滞だ」、「道の駅△△に到着」といったつぶやきのオンパレードである。7日までに4万件以上が集まった。そして急速に集まり方が減り、元の状態に戻った。

 8日に大学で、収集したデータをCSV形式でダウンロードして、Google BigQueryというサービスを使って中身を調べてみた。渋滞に巻き込まれて困った状況、道の駅でほっとしている状況、ゴールデンウィークのドライバーたちの動きがひしひしと伝わって来た。逐次スマホでつぶやいていたのだろう。誰に、というわけでもなく、みんなに聞いてもらいたいという気持ちが表れている。

 日本人は世界一ツイッター好きだそうだ。140文字で表現できる情報量が多いから、とか、匿名だから、という理由が挙げられているが、それよりも、「皆に聞いてもらいたい」意識、共感を求める意識が強いのだと思われる。ツイッターの拡散力がそれらを強めるのに使われているのだ。つぶやくことでイライラが軽減されてすっきりするし、同じような思いをしている人がいることを知れば渋滞のつらさも軽減される気がする。

 つぶやきがこのようなポジティブな効果をもたらすわけではないことも確かである。誤った情報、誹謗中傷などの負のつぶやきもまた拡散しうる。誹謗中傷はAIでも言葉を解釈して判断できそうだが、つぶやきが本当か嘘かの判断は難しいだろう。日本人の大好きなすっきりするつぶやきだけを拡散できる仕組みは作れないものだろうか。



コラム一覧へ