ソケッツ、ドラマのあらすじから感情をスコア化、2017年春ドラマの視聴率を予測

平成 29 年6月2日
各位
会社名 株式会社ソケッツ
代表者名 代表取締役社長 浦部 浩司
(証券コード:3634)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
ソケッツ、ドラマのあらすじから感情をスコア化、
2017 年春ドラマの視聴率を予測
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
株式会社ソケッツ(本社:東京都渋谷区、代表取締役社長:浦部浩司、以下「ソケッツ」

は、自社のMSDB(※)より抽出した、2003 年以降のプライムタイム放送の連続ドラマ
データから、感情分析エンジンを活用して、あらすじから感情スコア値を算出、視聴率と
の関係性を分析し、さらにドラマが表現する“感情”をベースとした視聴率予測モデルを
構築し、実際に現在放送中の今期春ドラマの視聴率予測を行ったレポートを公開いたしま
した。
ソケッツでは、音楽、映像、書籍をはじめとしたエンターテイメントに関するメタ情報と、
感情分析エンジンによる人の“感情”をキーとした分析予測から、商品開発・調達、マー
ケティング支援に向けた実用化を目指しております。



(※)MSDB(メディアサービス・データベース)とは、ソケッツが開発した音楽、映像、
書籍、放送、人物、施設、一般商品情報などを体系的かつ特徴情報を詳細に分類したデー
タベースであり、人の感性や感情を捕捉した「感性メタデータ」をキーとしたプロファイ
リング、アナリティクス、パーソナライズ、レコメンド、マーケティングサービスを実現
します。




2017 年春ドラマ視聴率を予測する シリーズ第 1 回
前回までは歌詞データを元に、ソケッツ感情分析に焦点を当ててご紹介してきましたが、
今回は、あらゆる年代、あらゆる人の想像力を掻き立てる、身近なエンターテイメント、
各局放映中の“春ドラマの視聴率予測”をお届けしたいと思います。
視聴率と言えば、2000 年代に入り、若者の「テレビ離れ」が叫ばれるようになり、さらに
近年では、録画視聴や見逃し配信などによる視聴の多様化により、「視聴率」という指標
自体がたびたび議論されるようになりました。視聴率の定義、捉え方は時を経て変化して
きているかもしれませんが、それでも、テレビ番組での紹介による爆発的ヒット現象や、
Twitter のトレンドを見ても、メディアとしてのテレビの影響度自体、揺らいでいないと感
じることも多いのではないでしょうか。
「大ヒットは予期せぬところから…」とよく言われますが、あえて、その難解な領域に、
データを活用した予測科学で踏み込んでみたいと思います。


――――――――――――――――――――――――――――
連続ドラマをデータから考察
――――――――――――――――――――――――――――
まず、対象データを、2003 年以降のプライムタイム(19 時~22 時台)の全国ネット主要 4
局の連続ドラマデータとして、MSDB より抽出することとします。



■2003 年 1 月期~2017 年 4 月期までの地上波プライムタイム(19 時~22 時台)全国
ネットの民放 4 局(日本テレビ、TBS、フジテレビ、テレビ朝日)の連続ドラマ


■上記に付随する、放送曜日・時間帯、ドラマジャンル、各話視聴率、平均視聴率、主
演、出演者、プロデューサー・監督・脚本などの付帯情報全般、あらすじデータ


■MSDB より抽出した上記データのうち、ドラマあらすじから感情分析エンジンで感情
スコア値を算出



本題の視聴率予測に入る前に、簡単に対象時期の視聴率推移をご紹介しておきたいと思い
ます。


こちらが 2003 年から昨年 2016 年までの、約 14 年間の視聴率推移です。




2005 年をピークに、想像通り、右肩下がりとなっています。
2005 年は、土9「ごくせん」(主演:仲間由紀恵)、月9「エンジン」(主演:木村拓哉)、木
10「電車男」(主演:伊藤淳史)、金 10「花より男子」(主演:井上真央、松本潤)をはじめ、
10 作品が最終回視聴率 20%越えという、ヒット作に恵まれた年でした。また、ジリ貧の中、
少しだけ持ち直した 2011 年は、水 10「家政婦のミタ」、日9「JIN-仁-(完結編)」が、
2013 年には日9「半沢直樹」が、それぞれ大ヒットし、この年の視聴率を牽引しています。




――――――――――――――――――――――――――――
連続ドラマ視聴率予測モデルを構築する
――――――――――――――――――――――――――――
それでは早速、最終回視聴率の予測モデルを構築していきたいと思います。
まずは一般的な重回帰分析で初回~5 週目までの視聴率デー
タを元に予測してみると、誤差±4 ポイント前後で 7 割程度
は実際の最終回視聴率の予測ができました。


ただ、肝心の大ヒットドラマ、または大低迷ドラマに関し
ては予測値が大きく外れる結果となりました。こちらを踏ま
えて、ドラマのあらすじから算出したソケッツ独自の感情ス
コア値を含め、ソケッツにしかできない予測モデルを構築し

ていくことにします。 参考① 重回帰分析結果

(縦軸:予測結果 横軸:最終話実測値)



最終回視聴率を予測するに当たり、影響度の高いデータを検証していきます。
まずは、そろそろお馴染になりつつあるソケッツ感情スコアについてですが、今まで同様、
10 種類の感情でそれぞれスコア値を算出しました。歌詞の時とはキーワードの受け取り方
が少し変わりますので、ワーディングはドラマのあらすじ仕様にしてあります。
この感情スコアでいえば視聴率と最も相関が高かったのは「昂ぶり・興味」でした。逆に
「退屈・うんざり」が 1 番影響度が低いスコアとなりました。
ちなみに、今回MSDBから抽出して利用したドラマのあらすじデータは、話数ごとでは
なく、各放送局のオフィシャルな番組紹介内容を元としたドラマ紹介的なあらすじ内容と
なっています。今回はこちらのデータから感情スコア値を算出していますが、このあらす
じデータのクオリティにより、感情スコア値の精度が左右されるといっても過言ではあり
ませんので、今後、予測モデルのチューニングとあわせて、あらすじデータの精度UPも
並行して調整していきたいと思います。


そのほか、MSDBから抽出したメタ情報、付帯情報などから、傾向値を俯瞰してみまし
た。




参考③ 出演回数と視聴率の相関
参考② 主役回数と視聴率の傾向をプロット
(縦軸:出演回数 横軸:視聴率)




さらに近年、放送中の番組内容がツイートされることが多い、Twitter での Tweet 数も視
聴率との相関関係が深いものと仮定し、予測モデルに取り込むことにしました。


その結果、以下のプロトタイプ版が出来上がりました。
【視聴率予測モデル プロトタイプ】


…………………………………………………………………(1)

今回は、あるドラマの 3 週目までの視聴率を とし、単純移動平均を とする。
は 1 話目、 は 2 話目、 は3 話目である。


あるドラマの Twitter の情報に関しては以下のように活用する。

……………………………………………………………… (2)

は 1 週目から 3 週目のあるドラマの 1 話ごとの放映週前後のドラマタイトル・愛称を含
む Tweet 数の単純移動平均である。


以上の(1)(2)を元にプロトタイプのモデルを記述する。
Y を求めることで各ドラマの視聴率を算出する。


感情スコア 感情スコア
………………………………… (3)



感情スコア 幸福・愛情 嬉しい・楽しい 安らぎ・信頼 昂り・興味 希望


感情スコア 不安・恐れ 怒り・苛立ち,哀しみ,嫌い・不愉快, 退屈・うんざり


感情スコア P はポジティブな感情、感情スコア N はネガティブな感情をベクトル化した
もの



上記予測モデルで過去の視聴率デー
タ実績に当てはめてみたところ、誤
差±1 ポイント以内に収まるモデル
となり、一般的な重回帰分析に比べ、
精度がUPしました。


こちらでいよいよ、今期春ドラマの最終回視聴率予測に挑みたいと思います!が、その前
に、最終回視聴率予測の答え合わせまで少し間があるのと、過去の視聴率推移の傾向から、
5 週目~8 週目の視聴率推移が重要ということが分かっていますので、こちらの予測モデル
で最終回視聴率とあわせて、前段で直近 9 週目視聴率の予測も行ってみたいと思います。
その結果…




さて、はたして結果はどうなるでしょうか…?


――――――――――――――――――――――――――――
最後に
――――――――――――――――――――――――――――
ドラマ視聴率については、ドラマが始まる前、主演の発表辺りから、頻繁にその「予想」
がなされ、盛り上がります。前評判や期待度が高いドラマでも蓋を開けてみたらいまいち
盛り上がらない…、なぜ視聴率を稼げなかったのか、あらゆる方面から考察され、話題に
され、私たちの目や耳に飛び込んできます。
ソケッツ視聴率予測シリーズ第 1 回目の本レポートでは、3 週目までの視聴率実績を元に、
MSDBから抽出したあらすじデータを元に感情スコア値を出し視聴率予測モデルを構築
しましたが、前述で少し触れたとおり、あらすじデータ次第で、算出される感情スコア値
が変動し、それが予測精度にも直結しますので、MSDBでのあらすじデータ自体の質の
向上、また主演俳優単体の評価だけではなく、キャスト全体を通して人に与えるイメージ
や相乗効果がもたらす影響、そして、Tweet 数のみならず、Tweet コメントからの感情ス
コア値算出とその相関反映など、人の感情をキーとした本格的な予測モデルへのチューニ
ングに向けて、まだまだ改善の余地があり、そこに可能性が広がっていると考えています。
次回は、9 週目視聴率予測の答え合わせとプロトタイプ版予測モデルのチューニング、あわ
せて、今回MSDBから抽出したメタ情報、付帯情報と、視聴率推移とで時期ごとの傾向
がみられた相関などをご紹介できればと思います。


ソケッツが目指す未来は、もちろん視聴率予測自体にとどまりません。
より細かい各話あらすじデータの感情分析、映像構成、セリフのひとつひとつから、人の
感情がどのように突き動かされ、どのように受け止められ、惹きつけられるのか、音楽同
様に人の感情を理解するコンテンツとして、ソケッツの映像研究も今後加速していきます。
ソケッツの感情分析エンジンがそれを理解することで、その時代に求められるドラマの本
質、キャスト、構成がどのようなものか、ヒット予測に伴う制作支援でもバリューを提供
していけるものと思います。
過去の事実情報からだけでは予期できないヒット要因を、人の感情をキーとして予測する、
ソケッツの挑戦にご期待ください。


「ソケッツレポート」の記事のご利用、また共同研究などに関するご相談はこちらのお問
い合わせフォームよりご連絡ください。
http://www.sockets.co.jp/inquiry/contact/policy.html

●公開日

平成 29 年6月2日(金)

●ソケッツレポート

2017 年春ドラマ視聴率を予測する シリーズ第 1 回

http://www.sockets.co.jp/kansei/kansei_report03.html




株式会社ソケッツ:
(http://www.sockets.co.jp/)
株式会社ソケッツは、平成12年6月に設立された「人の気持ちをつなぐ」という事業目
的を持ったデータベースサービス会社です。現在、KDDI株式会社、株式会社NTTド
コモ、カルチュア・コンビニエンス・クラブ株式会社などへの音楽や映像、書籍などを中
心とした検索・レコメンド・ストリーミング・データ提供・アナリティクスなどのデータ
関連サービスを行っております。


本リリースに関するお問い合わせ先:
株式会社ソケッツ
〒151-0051 東京都渋谷区千駄ヶ谷4-23-5JPR 千駄ヶ谷ビル3F
担当:コーポレート本部 小田嶋
Tel:03-5785-5518 Fax:03-5785-5517
E-mail:ir@sockets.co.jp
以上

14681