2013ユーキャン新語流行語大賞を、Twitterソーシャルデータ解析で大予測

shingo

(この記事は、ビジネスジャーナルに2013/11/29寄稿した記事と同内容のものです)

11月最後の更新です。アクトゼロの黒沼です。

 今年も現代用語の基礎知識による「2013ユーキャン新語流行語大賞」が話題です。今週ノミネートとなる50ワードが発表されましたが、今回は実際にTwitter上で人気を集めたワードが何だったのか、候補ワードの中から、勝手に有力候補を選んでみたいと思います。ノミネート50ワードは以下のとおりです。

 PM2.5/NISA(ニーサ)/母さん助けて詐欺/弾丸登山/美文字/DJポリス/ななつ星/パズドラ/ビッグデータ/SNEP(スネップ)/ヘイトスピーチ/さとり世代/ダークツーリズム/ご当地電力/ご当地キャラ/こじらせ女子/富士山/日傘男子/バカッター/激おこぷんぷん丸/困り顔メイク/涙袋メイク/倍返し/今でしょ/ダイオウイカ/じぇじぇじぇ/あまロス/ビッグダディ/ハダカの美奈子/ふなっしー/フライングゲット/マイナンバー/NSC/アベノミクス/3本の矢/集団的自衛権/特定秘密/汚染水/ブラック企業/限定正社員/追い出し部屋/ナチスの手口に学んだら/ネット選挙/アホノミクス/引いたら負け/二刀流/スポーツの底力/シライ/お・も・て・な・し/コントロールされている

―新語流行語大賞公式サイトより引用

ビッグデータ/オープンデータ/ソーシャルデータ

 今回のノミネートワードにある通り、いま「ビッグデータ分析」が活況です。その他にも自治体や公的機関の公表データを分析対象とする「オープンデータ分析」などが盛り上がりを見せています。そして今、ネットマーケティング業界で熱いのは、ソーシャルメディア・ブログ・掲示板上でユーザーが自由に行っている情報発信を、言語分析などを用いて解析する「ソーシャルデータ分析」です。

 今回はデータセクション株式会社の解析ツールInsight Intelligenceを使用して、Twitter上の日本語を中心としたツイートのなかから、10%分のツイートデータ(集計期間:2013/01/01~2013/11/24)をサンプリングして新語・流行語大賞ノミネート50ワードのなかで、Twitterで人気だった新語・流行語は何だったのかを検証していきたいと思います。

 まずは本家の選考にならって、上位10ワード「トップテン」を選出します!

Twitter出現率ランキング「トップテン」

c1

 ツイート上での出現率ランキングは以上のようになりました。人気ソーシャルゲームの「パズドラ」が年間を通して高い出現率を維持し続け、堂々の第1位です。いわゆる流行語として有力視されていた「今でしょ」「倍返し」「じぇじぇじぇ」などの中では、「今でしょ」がもっとも使われた流行語となっています。上位10ワードは以上のとおりですが、ちなみに11位は「PM2.5」、12位は「ダイオウイカ」となっています。

  ここからは、これら上位10ワード「トップテン」+11位12位の2ワードの中での傾向を細かく見ていきます。

最大瞬間風速ランキング

c2

 各ワードにおける週間計測で、最もツイート数が大きかった週のツイート数を元にランキング評価を行いました。最も短期間で強い「流行」が起きたワードは何だったのかが計測できます。

 ここでトップに踊り出たのは、総ツイート数では、トップテン入りできなかったワード「PM2.5」です。2013/3/4の週にもっとも強い盛り上がりを見せましたが、新聞各社がPM2.5の飛来について速報を報じた瞬間でした。同時期は花粉症のピークでもあることから、マスク姿の人が多かったですね。

 続いて「パスドラ」、「ふなっしー」と続きます。

 「ふなっしー」は2013/8/19にピークを迎えます。この週ふなっしーは「笑っていいとも!」に出演していました。「ふなっしーがいいとも出てるぞ!」と言った感じで、この週だけで57,000ツイートされています。ダイオウイカは2013/1にNHKで放送されたドキュメンタリー番組を皮切りに一瞬大いに盛り上がりましたが、すぐに鎮火していきました。

ポジティブ・ネガティブ傾向ランキング

 次にそのワードが、どういった文脈の中で使われていたかを解析し、その言葉を使った人がポジティブな意味合いで語ったワードか、ネガティブな意味合いで使ったワードかでその傾向の強さをランキングしました。

posinega

 最も前向きに使われていたワード第一位は「富士山」で、世界遺産登録の際に、それを祝福するツイートがあふれました。第二位は僅差で「パズドラ」です。ゲームに対するポジティブな感想や、「魔法石+ほしい」と言った形で、ゲーム内容に対して日常的にツイートするユーザーが数多くいました。パズドラの盛り上がり具合がわかります。

 最もネガティブに使われていたワードは第一位「PM2.5」で連日の報道から、不安を感じるユーザーが多くいたことがわかります。僅差で第二位「汚染水」がつけていることからも、日常安全が脅かされることに対する不安感をツイートするユーザーの姿が浮かんできます。第三位に「ブラック企業」がつけています。

性別・世代別利用傾向ランキング

 Twitterユーザーの言語分析を行うと、その発言内容の傾向から男女性別や世代などが、およそ80%~90%の確度で特定可能です。性別と各世代別で上位12ワードのうち、各ワードがどのような人たちに利用されている傾向が高かったかを定性的に比較します。

sexgene

 まずは男女比です。最も男性の利用傾向が高かったのは「アベノミクス」です。政治・経済ネタということも有り、男性中心に話題が消費されていました。女性の利用傾向が最も高かったのは「ふなっしー」でした。意外と女性ファン多いのですね…。

 各ワード利用者のうち、最も発言した世代が偏っていたワードを抽出しました。ツイートの量で各ワードを比較するのではなく、各ワード利用者の世代別ツイート比率で比較をしています。10代で最も利用傾向の高かったワードは「激おこぷんぷん丸」でした。20代では「パズドラ」が圧倒的な強さを見せ、子育て世代の30代は「PM2.5」への関心が高いようです。「ブラック企業」は20~40代の働き盛りの世代で広く話題になっていましたが、他ワードに比べて40代が最も利用傾向が強くでました。50代の利用傾向が高かったのは「汚染水」で主に政治のあり方を語るツイートの中で、汚染水というワードに触れるケースが見受けられました。60代でも「汚染水」問題を語るツイートは多く存在するのですが、こちらではほんの少しだけ「アベノミクス」への言及傾向のほうが見うけられました。

まとめ:流行語予想

 いかがでしたでしょうか?ソーシャルデータ分析を使った「実験」でしたが、最後に流行語予想をしてみたいと思います。
(※と、ここまで書いて、実はトライバルメディアハウスさんが、同じ企画でリリースしているのを知って愕然としています。後出しじゃんけんとなりますが、せっかくなので最後まで書きます)

  いわゆる流行語という意味合いでは、使用された実数も、瞬間速度も大きい「今でしょ」の底堅さが感じられます。次点で「倍返し」「激おこぷんぷん丸」ですが、「激おこ」が10代~30代に「倍返し」が20代~40代と広く使われているため、どちらも候補としては申し分ないため悩みどころです。

 が、ここはブームがより年末に近かった「倍返し」を対抗と予測しておきます。

  以下今年を象徴するといった意味合いの強いトップテンに選ばれそうなワード予想ですが、政治経済のワードとしては「アベノミクス」がもっとも有力です。Twitterユーザー層と相性がいい「パズドラ」も、流行語大賞は難しいとしても、トップテン入りは狙えるのではないでしょうか?今年を代表する愛されキャラクターとして「ふなっしー」も間違いなく選ばれると予想します。会見を大いに沸かせることでしょう。

 社会問題としての「PM2.5」「汚染水」のどちらかもトップテン入りが妥当なのではないかと思います。今まで存在していなかった造語という意味合いでは「ブラック企業」にも一定の評価がありそうです。

 みなさんは、何が選ばれると思いますか?大賞発表は12/2(月)の予定です。