ソケッツ、歌詞と四字熟語の感情分析から「表現したい世界観」を可視化、プロモーション支援に向け実用化へ

平成 29 年4月 21 日
各位
会社名 株式会社ソケッツ
代表者名 代表取締役社長 浦部 浩司
(証券コード:3634)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
ソケッツ、歌詞と四字熟語の感情分析から「表現したい世界観」を可視化、
プロモーション支援に向け実用化へ
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
株式会社ソケッツ(本社:東京都渋谷区、代表取締役社長:浦部浩司、以下「ソケッツ」

は、自社の感情分析エンジンを活用して、歌詞の感情分析結果と、故事や仏典に基づく慣
用句を筆頭に、相撲の昇進伝達式での口上や、企業経営・戦略に直結する示唆として多く
用いられる四字熟語を関連付けることで「表現したい世界観」を可視化した分析レポート
を公開いたしました。
本事例をはじめとした感情分析エンジンの研究開発の取り組みにおいては、アーティスト/
クリエイターと企業や商品、そしてエリアをつなぐキャスティングやタイアップなどのプ
ロモーション支援に向けた実用化を目指し、本年度、実証実験や準備を推進してまいりま
す。




「表現したい世界観」
「なりたいイメージ」が四字熟語でつながる?!
前回年末に行った、感情分析からの勝敗予測については、途中経過を覆し、最終的に見事
的中しました!
(参照:http://www.sockets.co.jp/kansei/kansei_report01.html)
さて、今回は前回の予測でも行った感情分析に焦点を当てて、もう少し詳しくご紹介して
いきたいと思います。
まず前回も少しご説明しましたが、ソケッツの感情分析エンジンはエンターテイメントの
感性メタを教師データとして感情を分析します。
エンターテイメント作品の感情を分析する、とは、言い換えれば、作品の「世界観」を見
える化する作業ともいえます。ここでいう「世界観」とは、単なる知的な理解にとどまら
ず、より感情と意思、つまり心持などの情意的な評価を含むものと定義しておきます。
ということで、今回は歌詞データを感情スコア化、さらに感情スコア値の類似性から、歌
詞の世界観に類似した情報を、歌詞とは直接的なつながりのない四字熟語に関連付けてみ
たいと思います。
ひと言で四字熟語といっても広義から狭義まで様々ですが、故事や仏典に基づく慣用句を
筆頭に、相撲の昇進伝達式での口上や、企業経営・戦略に直結する示唆として、また企業・
経営理念などでも多く用いられ、いわば「真善美(※1)」の世界が四文字に凝縮されている
四字熟語を媒体とすることで、エンターテイメント内での相関・つながりにとどまらない
可能性をお届けしたいと思います。


(※1)真善美とは、人間の理想としての普遍妥当な価値のことを意味します。


――――――――――――――――――――――――――――
今回のレポート条件
――――――――――――――――――――――――――――
対象データ、概要は以下の通りとしました。



■1980 年以降にリリースされたシングル楽曲をソケッツの MSDB(※2)より抽出し
た 19,363 曲の歌詞データをもとに感情スコアを算出


■四字熟語は自然や季節などを表すものなどは除外し、気持ちや感情を含む熟語 848 つ
を対象に、四字熟語の説明テキストを感情スコア化


■今回は結果の精度判断をしやすいように、『おおよその歌詞を知っていて、かつ世界
観がイメージできる曲』について、ソケッツ社内でアンケートを取り、その結果上位 10
曲の感情スコア値の類似性を解析、類似度の高い上位 2 つの四字熟語を関連付けること
とします。



(※2)MSDB(メディアサービス・データベース)とは、ソケッツが開発した音楽、映
像、書籍、放送、人物、施設、一般商品情報などを体系的かつ特徴情報を詳細に分類した
データベースであり、人の感性や感情を捕捉した「感性メタデータ」をキーとしたプロフ
ァイリング、アナリティクス、パーソナライズ、レコメンド、マーケティングサービスを
実現します。


――――――――――――――――――――――――――――
対象楽曲の感情スコアのサマリー
――――――――――――――――――――――――――――
ここで改めて、感情分析エンジンでの感情スコア値の算出についてご説明しておくと、構
文を考慮した自然言語解析で、歌詞のセンテンスごとに 10 種類の感情スコア値を算出、セ
ンテンスごとではなく楽曲単位での感情スコア化する場合には、検出された感情スコア値
は単純に加算して評価しているのではなく、より人間の感覚に近い値が得られるというソ
ケッツの研究結果から、歌詞のセンテンスごとに算出した感情スコア値を元に、歌詞の流
れを考慮したうえで、最終的なスコア値を算出しています。
つまり、楽曲単位での感情スコア値は最初から最後まで通して受ける感情を評価したスコ
アリングとなります。
まずは、ソケッツの MSDB から抽出した 1980 年以降にリリースされたシングル楽曲歌詞
データの感情スコア値について、対象 19,363 曲のサマリーを簡単にご紹介します。


(1)感情スコア分布
19,363 曲の各楽曲で算出された感情スコアで、1 曲の中にどの感情がどの程度詰め込まれ
たストーリーとなっているかを感情スコアの分布から見てみたいと思います。まず曲のス
トーリー、世界観の要約、というところで、楽曲単位での平均値以上の感情数と各感情値
での楽曲数分布をまとめてみました。




全体でみると、平均値以上の感情スコアが 4 種類以上の曲が 1 番多く、次いで 3 種類、5
種類となっています。


感情別分布でみると、
① 4 種類の感情スコアが平均値以上で「哀しみ」のスコアが 1 番高い楽曲 2,909 曲 対
象楽曲数のうち 15.0%
② 3 種類の感情スコアが平均値以上で「哀しみ」のスコアが 1 番高い楽曲 2,209 曲 対
象楽曲数のうち 11.4%
③ 4 種類の感情スコアが平均値以上で「昂ぶり」のスコアが 1 番高い楽曲 1,912 曲 対
象楽曲数のうち 9.9%
④ 4 種類の感情スコアが平均値以上で「幸福・恋愛」のスコアが 1 番高い楽曲 1,519 曲
対象楽曲数のうち 7.8%
⑤ 3 種類の感情スコアが平均値以上で「昂ぶり」のスコアが 1 番高い楽曲 1,483 曲 対
象楽曲数のうち 7.7%


平均値以上の感情スコアが 3,4 種類の「哀しみ」「昂ぶり」「幸福・恋愛」のいずれかが
突出した楽曲は 10,032 曲で全体の 51.8%で対象の半数以上を占めました。


(2)高スコアの感情値掛け合わせ分布
次に、それぞれの楽曲で、どの感情値が高いのか、1 番高い感情値と 2 番目に高い感情値で
の分布を見てみました。




① 「哀しみ」「幸福・恋愛」 2,406 曲 対象楽曲数のうち 12.4%
② 「哀しみ」「昂ぶり」 1,772 曲 対象楽曲数のうち 9.2%
③ 「哀しみ」「昂ぶり」 1,633 曲 対象楽曲数のうち 8.4%
④ 「昂ぶり」「哀しみ」 1,599 曲 対象楽曲数のうち 8.3%
⑤ 「幸福・恋愛」「哀しみ」 1,550 曲 対象楽曲数のうち 8.0%


前回の紅白優勝予測でのロジスティック回帰分析の結果も、係数が 1 番大きかったのは「哀
しみ」で影響度が高いとみなし予測モデルを構築しましたが、今回の分析対象楽曲中「哀
しみ」が 1 番高スコアだった楽曲は 6,894 曲で 35.6%、邦楽は比較的「哀しみ」の要素が
世界観の作品が多いようです。


(3)リリース時期ごとの高スコア感情分布
最後に、リリース時期ごとに見た、1 番突出していた感情値の分布は以下のようになってい
ました。
「昂ぶり」「希望」の割合は拡大傾向にあり、特に「昂ぶり」は「哀しみ」に迫る勢いと
なっています。
J-POP の恋愛ソングの多さが話題になることが多い中、意外なことに「幸福・恋愛」の割
合は減少しています。また、「希望」はわずかながらではありますが、徐々に拡大してき
ています。


――――――――――――――――――――――――――――
歌詞と四字熟語の関連付け結果を見てみる
――――――――――――――――――――――――――――
それではいよいよ『おおよその歌詞を知っていて、かつ世界観がイメージできる曲』(ソ
ケッツ社内アンケート上位 10 曲)の楽曲をベースとして、感情スコア値の類似度の高い上
位 2 つの四字熟語が、楽曲の世界観を表せているか、結果を見ていきたいと思います。



『おおよその歌詞を知っていて、かつ世界観がイメージできる曲』(ソケッツ社内アンケー
ト上位 10 曲)

1. 世界に一つだけの花 SMAP
2. ハナミズキ 一青窈
3. 何度でも DREAMS COME TRUE
4. One Love 嵐
5. もう恋なんてしない 槇原敬之
6. 地上の星 中島みゆき
7. CAN YOU CELEBRATE? 安室奈美恵
8. 春よ、来い 松任谷由実
9. 真夏の果実 サザンオールスターズ
10. 終わりなき旅 Mr.Children
いかがでしょうか。四字熟語の意味と曲の世界観、なかなか相関性の高い関連付けとなっ
ているのではないでしょうか。
感情分析エンジンは、単純なキーワード抽出処理ではなく、取り扱いデータにより、話し
言葉、擬音等の混入など、それぞれでコーパスを作り精度を上げ、構文解析によって難し
い文脈や言い回しにも対応し、高精度な感情スコア化を実現していますので、NO.5『もう
恋なんてしない』に登場する、「もう 恋なんて しない なんて 言わないよ 絶対」
という人が最後まで聞かないと理解できない意味の解釈も正確に行い、スコアリングして
います。


その結果として、NO.3『何度でも』と NO.5『もう恋なんてしない』、曲のテーマ、印象
が全く異なる両曲でともに関連付けられている「堅忍不抜(意志が強く、辛いことや困難
なことがあっても耐えて、信念を貫くこと)」は、両曲の歌詞を表す四字熟語として違和
感ない結果を得ています。


――――――――――――――――――――――――――――
まとめ
――――――――――――――――――――――――――――
このようにソケッツの感情分析エンジンは、従来のキーワードマッチングによる方法では
なく、「気持ち」や「感情」の類似した情報を見つけ、歌詞データにとどまらず、人の感
情に基づく他のデータの取り扱いが可能で、さらに関連付けることができます。
たとえば、“辛いことや困難なことがあっても耐えて、信念を貫く”という世界観やイメ
ージを持たせたい企業や商品があったとして、今回の結果からいえば、NO.3『何度でも』
をタイアップソングやテーマソングとするなど、「なりたいイメージ」と「表現したい世
界観」の楽曲が、四字熟語を媒体としてつながるわけです。
近年、自然言語処理で潜在意味解析という文脈で発展してきたトピックモデルは、簡単に
いえば、データの背後にある隠れた「トピック」を推定するということですが、今回の四
字熟語はまさに“隠れたトピック≒潜在意味”と同等であると位置づけられるかもしれま
せん。
今後、四字熟語は前述した相撲の口上や企業経営視点以外に、ドラマや CM などのキャス
ティングやプロモーション・タイアップにおいても、四字熟語を媒体として、アーティス
ト/クリエイターと企業や商品がつながる、なんていうことが当たり前になるかもしれませ
ん!?


(※3)トピックモデルとは、文書中の各単語およびそれらの単語が属するトピックが確
率的に生成されていると仮定するモデルで、文書から「何らかの話題(=トピック)」を発見
するための統計的なモデルです。


「ソケッツレポート」の記事のご利用、また共同研究などに関するご相談はこちらのお問
い合わせフォームよりご連絡ください。
http://www.sockets.co.jp/inquiry/contact/policy.html

●公開日

平成 29 年4月 26 日(水)

●ソケッツレポート

「表現したい世界観」「なりたいイメージ」が四字熟語でつながる?!

http://www.sockets.co.jp/kansei/kansei_report02.html




株式会社ソケッツ:
(http://www.sockets.co.jp/)
株式会社ソケッツは、平成 12 年6月に設立された、「人の気持ちをつなぐ」という事業目
的を持ったモバイルインターネット分野を中心としたサービス、アプリケーション、デー
タベースの開発会社です。現在、KDDI株式会社や株式会社NTTドコモなどへの音楽
や映像、電子書籍などの検索サービスやストリーミングサービスに加え、カルチュア・コ
ンビニエンス・クラブ株式会社や楽天株式会社への作品おすすめ(レコメンド)機能の提
供、国内最大級の楽曲データベースを活かした自社開発パーソナライズドサービス
「LIFE’s radio」の提供などを行っております。
本リリースに関するお問い合わせ先:
株式会社ソケッツ
〒151-0051 東京都渋谷区千駄ヶ谷4-23-5JPR 千駄ヶ谷ビル3F
担当:コーポレート本部 小田嶋
Tel:03-5785-5518 Fax:03-5785-5517
E-mail:ir@sockets.co.jp
以上

15781

新着おすすめ記事