ソケッツ、紅白歌合戦の曲目の歌詞データから“感情”を分析、さらに今年の勝敗を予測

平成 28 年 12 月 28 日
各位
会社名 株式会社ソケッツ
代表者名 代表取締役社長 浦部 浩司
(証券コード:3634)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
ソケッツ、紅白歌合戦の曲目の歌詞データから
“感情”を分析、さらに今年の勝敗を予測
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
株式会社ソケッツ(本社:東京都渋谷区、代表取締役社長:浦部浩司、以下「ソケッツ」

は、熟練スタッフが実際に商品を「見て」「聞いて」「読んで」約 2,000 項目に及ぶ感覚表
現メタをチョイスしたオリジナルの人力メタデータである「感性メタ(※)
」を教師データ
として、2 部制がはじまった第 40 回 1989(平成元年)以降から、本年度第 67 回 2016(平
成 28 年)の紅白歌合戦で、紅白それぞれに分かれて披露された楽曲を対象に歌詞データか
ら“感情”を分析、さらにその結果から今年の勝敗予測を公開いたしました。

(※)感性メタとは、特に日本の繊細な感性表現にこだわり、たとえば音楽の歌詞におい
ては全てを読み、内容の真意を理解してから付与するなど機械には出来ない膨大な作業に
よって生まれた国内唯一のエンターテイメントメタ(ゲノム)データです。



――――――――――――――――――――――――――――
紅白歌合戦の歌詞データの感情をスコアリング
――――――――――――――――――――――――――――
今回は、2 部制がはじまった、第 40 回 1989(平成元年)以降から、先日 2016 年 12 月 19
日に曲目が発表された本年度第 67 回 2016(平成 28 年)の紅白歌合戦で、紅白それぞれに
分かれて披露された楽曲を対象とすることにしました。



対象期間:第 40 回 1989(平成元年)~第 67 回 2016(平成 28 年)
※紅組・白組の垣根を越えて披露された楽曲は対象外とする
※『紅白エディション』はオリジナル楽曲の歌詞を解析対象とする
※メドレーは対象外とする
全 28 回、全対象楽曲 1,358 曲 うち紅組 692 曲、白組 666 曲
今回のメドレーなどの対象外含む全披露楽曲 1,464 対象率 93%
そして、今回の分析では、感情に関するキーワードを以下の 10 種類に絞りました。




まずは、各楽曲の歌詞データに現れるキーワードの中から、感情に関するフレーズを抽出
し、上記 10 種ごとに分類します。この分類の際にソケッツの感性メタを教師データとして
分類しています。


事例:第 67 回 2016(平成 28 年)白組出場 RADWIMPS/前前前世




感情ごとに分類したフレーズをスコア化します。
全対象楽曲 1,358 曲のスコア化が完了したら、年代・紅白の組ごとに数値を集計、個々の
感情スコア値ごとに正規化します。
ちなみに、その結果を、年ごとに最大値が 2 になるように平準化しグラフに出力したもの
がこちらです。


※下記は、本年度 2016 年分を含んだ直近 3 年間のグラフ




さらに、感情別に各年代・紅白別の推移をグラフで見てみましょう。




今年 2016 年の楽曲は、紅組は「哀しみ」のスコアが高く、白組は「不安・恐怖」のスコア
が高いようです。


それぞれどの楽曲が影響しているのか見てみると、




どうでしょうか。それぞれの歌詞が思い浮かぶ方は、なんとなく高スコアの要因がイメー
ジできるのではないでしょうか。


ちなみに、感情に関わらず歌詞によく登場するフレーズは特に年ごとに特徴があるわけで
はなく、一般的に J-POP でよくつかわれるフレーズでした。




――――――――――――――――――――――――――――
感情スコアを分析し、勝敗の予測モデルを作ってみる
――――――――――――――――――――――――――――
さて、紅白の勝敗といえば、楽曲そのものでの勝負というわけではなく、対抗形式で歌や
演奏を披露し、全体のショーを通して最後に勝敗を決める、というものであり、歌詞の感
情分析と勝敗の因果関係と結び付けるのは難しいものがあると思いますが、そこをあえて、
今回は、この感情分析と過去の勝敗のみで他の相関・要素を入れずにシンプルに分析して
いくことにします。
上述の感情スコア値のグラフを見ても分かる通り、感情スコ
アと勝敗には、パッとみる限り、相関は特に見当たりません
が、まずは主成分分析などをはじめ「データをよく見る」こ
とからはじめていきます。


そして、今回は勝敗を予測するために、ロジスティック回帰
分析で予測モデルを作ってみたいと思います。


ロジスティック回帰分析とは、ある現象の発生する確率を、その現象の起因を説明するた
めに観測された変数群によって説明をするための分析手法です。今回の目的では、 (1.0)
勝ち
か負け(0.0)かを、その現象の規制を説明するために観測された変数群として感情スコア
を利用して予測するものです。


このとき 勝ち(1)/負け(0) という値で得られている変数は 1 もしくは 0 という 2
値のいずれかで示され、この 1 もしくは 0 という値を、他の説明変数が決定付けている、
もしくは影響を与えているとみなして分析を行ない、数式を構築します。


年別、紅白別の 10 種の感情スコアから分析した回帰係数は下記のようになりました。


この係数が大きいほど、勝敗への影響度が高いとみなされます。
この推定されたモデル式を用いて、過去計 27 年間×紅白別の
全 54 の予測値を算出し、年ごとに紅白で比較をして高い予測
確率である方が「勝利する」という予測をしました。




――――――――――――――――――――――――――――
勝敗の予測モデルの正解率と今年の勝敗予想
――――――――――――――――――――――――――――
さて、できあがった予測モデルに当てはめた時の、勝敗実績の正解率はどのような感じで
しょうか。
今回対象とした過去 27 回のうち、予測モデルに当てはめたときに、


・紅が勝つ予測:9 件
○紅が実際に優勝:8 件 ×白が実際に優勝:1 件 ⇒正解率 89%


・白が勝つ予測:17 件
○白が実際に優勝:17 件 ×紅が実際に優勝:0 件 ⇒正解率 100%


全 27 回分トータルで、正解率 96%という結果になりました。



実際のビッグデータ分析・予測においては、今回のロジスティック回帰分析にとどまらず、
ニューラルネットワークでさらに精度を追求、また、主成分分析などを行ったりしますが、
分かりづらくなるので、今回はここでとどめて、この予測モデルに当てはめて、今年 2016
年の紅白の勝敗を予測すると…
予測モデルの理論値において、紅白で比較して高い値の方が
「勝利する」ということは…ソケッツ感情分析からの今年
2016 年の紅白歌合戦は、ずばり紅組の優勝が予想されました。
さて、結果はいかに…?!


――――――――――――――――――――――――――――
最後に
――――――――――――――――――――――――――――
今回は紅白歌合戦の歌詞を感情分析して、さらに勝敗予想してみるというレポートでした
が、「感情分析エンジン」の技術開発では、様々な角度から研究を行っています。
様々なデバイスを利用しているユーザーの感情を読み取る場合、単純にユーザーアクショ
ンやコメント内容からのみの感情抽出だけでは人の複雑な感情を推測はできません。
感情状態の時系列分析をおこない、状態変化を推定するような処理が必要となります。
人間と同等の知能をもつ人工知能に、人の感情を理解できる『感性』をもたせられたら…
人の『感性』や『感情』を扱ってきたソケッツだから目指すべきこと、そして実現できる
こと。
今後もソケッツの技術研究開発にご期待ください。
「ソケッツレポート」の記事のご利用、また共同研究などに関するご相談はこちらのお問
い合わせフォームよりご連絡ください。
http://www.sockets.co.jp/inquiry/contact/policy.html

●公開日

平成 28 年 12 月 28 日(水)

●ソケッツレポート

http://www.sockets.co.jp/kansei/kansei_report01.html



株式会社ソケッツ:
(http://www.sockets.co.jp/)
株式会社ソケッツは、平成 12 年6月に設立された、「人の気持ちをつなぐ」という事業目
的を持ったモバイルインターネット分野を中心としたサービス、アプリケーション、デー
タベースの開発会社です。現在、KDDI株式会社や株式会社NTTドコモなどへの音楽
や映像、電子書籍などの検索サービスやストリーミングサービスに加え、カルチュア・コ
ンビニエンス・クラブ株式会社や楽天株式会社への作品おすすめ(レコメンド)機能の提
供、国内最大級の楽曲データベースを活かした自社開発パーソナライズドサービス
「LIFE’s radio」の提供などを行っております。


本リリースに関するお問い合わせ先:
株式会社ソケッツ
〒151-0051 東京都渋谷区千駄ヶ谷4-23-5JPR 千駄ヶ谷ビル3F
担当:コーポレート本部 小田嶋
Tel:03-5785-5518 Fax:03-5785-5517
E-mail:ir@sockets.co.jp
以上

11190