ソケッツ、連続ドラマの視聴率予測シリーズ第4回レポートを公開 ~ いよいよ初回視聴率予測、本格的なヒット予測に向けた次ステージへ ~

平成 29 年9月1日
各位
会社名 株式会社ソケッツ
代表者名 代表取締役社長 浦部 浩司
(証券コード:3634)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
ソケッツ、連続ドラマの視聴率予測シリーズ第4回レポートを公開
~ いよいよ初回視聴率予測、本格的なヒット予測に向けた次ステージへ ~
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
株式会社ソケッツ(本社:東京都渋谷区、代表取締役社長:浦部浩司、以下「ソケッツ」

は、前クール最終回視聴率予測結果の正解率 78%に続き、前第 3 回レポートにて、新たに
初回視聴率予測に挑戦、今回その答え合わせと、過去ドラマ平均視聴率 20%以上のヒット
ドラマとそれ以外のドラマでの特徴的なキーワードの差分などの分析結果を総括したレポ
ートを公開いたしました。
ソケッツでは感性 AI でのノウハウを生かした「アーティストアナリティクスサービス」に
続き、本格的なヒット予測、また、音楽、映像、書籍をはじめとしたエンターテイメント
に関する、商品開発・調達、マーケティング支援に向けた実用化を目指し、新たなステー
ジへ研究開発を加速させていきます。


(※)MSDB(メディアサービス・データベース)とは、ソケッツが開発した音楽、映像、
書籍、放送、人物、施設、一般商品情報などを体系的かつ特徴情報を詳細に分類したデー
タベースであり、人の感性や感情を捕捉した「感性メタデータ」をキーとしたプロファイ
リング、アナリティクス、パーソナライズ、レコメンド、マーケティングサービスを実現
します。




2017 年連続ドラマ視聴率を予測する シリーズ第4回



さて、連続ドラマの最終回視聴率の予測からはじまった本シリーズですが、前回今期クー
ルの初回視聴率予測に新たに挑戦しました。
まずは、そちらの結果の答え合わせから見ていきたいと思います。
――――――――――――――――――――――――――――
前回予測、今期クール初回視聴率結果
――――――――――――――――――――――――――――
最初に軽く、前回の初回視聴率予測モデルのおさらいをしておきたいと思います。
(詳しくは、前回レポート視聴率予測シリーズ第 3 回をご参照ください。)
ドラマ自体の視聴者吸引力(ドラマキャッチコピーや紹介文、キャスト、プロモーション
他)と、それに対する視聴者の期待値と、その動向(視聴者がそのドラマをリアルタイム
に楽しむのか、録画などで楽しむのか)を読み解くために、まだまだ盛り込みたい要素は
多々ありましたが、以降のチューニングに向けた課題を明らかとするために、以下のよう
なシンプルなモデルでスタートしました。


初回視聴率予測モデル プロトタイプ版
1.あらすじの感情スコア値
2.主役・出演者などの過去視聴率寄与スコア
3.放送前公式 Twitter アカウントの有無と「いいね」数


また、本視聴率予測シリーズに関する弊社MSDBの利用データ、対象条件は以下になり
ます。

■2003 年 1 月期~2017 年 4 月期までの地上波プライムタイム(19 時~22 時台)全国
ネットの民放 4 局(日本テレビ、TBS、フジテレビ、テレビ朝日)の連続ドラマ


■上記に付随する、放送曜日・時間帯、ドラマジャンル、各話視聴率、平均視聴率(※)、
主演、出演者、プロデューサー・監督・脚本などの付帯情報全般、あらすじデータ


■MSDB より抽出した上記データのうち、ドラマあらすじから感情分析エンジンで感情
スコア値を算出



(※)過去視聴率実績出典:「ビデオリサーチ社調べ」


そして、上記モデルでの予測と、実際の初回視聴率結果がこちらです。
※ 判定は、誤差±1 ポイント以上は不正解×、±0.6 ポイント以上 1 ポイント未満はドロ
ー△、0.5 ポイント以内は正解◎としています。
結果、5 勝 7 敗 1 引き分け、正解率 42%となりました。
目標としていた正解率 50%には残念ながら届きませんでした。視聴者の期待値およびリア
ルタイム視聴への動機付けに関して、スコアリングの甘さの結果となります。つまり、改
めてキーとなるのは人の「感情」を理解することと言えそうです。
さて、それでは今回、考察結果として、誤差範囲が大きかった上位 3 つをピックアップし
てご説明していきたいと思います。


●フジの木 10 時枠「セシルのもくろみ」 +4.6 ポイント差
こちらは放送スタート前から、「カンナさーん!」と並んで、もっとも SNS プロモーショ
ンを積極的に行っており、さらに、それにより『放送前公式 Twitter アカウントの有無と「い
いね」数』での重みづけにより、もっとも誤差が大きくなったことが原因と言えます。
ここで「セシルのもくろみ」と「カンナさーん」の Tweet 数を比較してみましょう。
すると初回は「セ
シルのもくろみ」
が非常に伸びてい
ましたがそれ以降
停滞していってい
ることがわかりま
す。
SNS とテレビとの相関は、放送中の番組内容が Tweet されることが多いという考察が近年、
行われるようになり、視聴者の事前期待値を図るための手段として予測モデルに取り入れ
ましたが、Twitter を閲覧、利用するユーザーのドラマに対する純粋な興味・期待値のみを
測るには、もう少し繊細なロジックを検討する必要がありそうです。初回のドラマにおけ
る視聴者の感想・感情もヒントにしつつ、Twitter を利用しない視聴者層の事前期待値をど
う加味するか、検討してきたいと思います。


●フジの木 10 時枠「僕たちがやりました」 +3.5 ポイント差
主役、出演者などの過去視聴率寄与スコアの上ブレとなります。主役の演技力など事前評
価は高かったものの初回視聴率につながらなかったのは何なのか。少し偏ったターゲット
層向けとも思えるドラマ内容による関係があるのか、視聴者吸引力に欠けたその他の要因
とそれをデータから事前にどう読み解けるのか、ここは今後少し時間をかけて分析してい
きたいと思います。


●日テレの日 10 時枠「愛してたって、秘密はある。」 +1.9 ポイント差
こちらも「セシルのもくろみ」同様、『放送前公式 Twitter アカウントの有無と「いいね」
数』でのブレが主な原因と考えます。MSDBでのジャンルは“ラブミステリー”ですが、
本レポート上、対象ドラマのジャンルは全 31 カテゴリに再分類し分析しているため、“恋
愛ドラマ”として分類しています。同枠での過去放映ドラマ内容を見ても、比較的ミステ
リー・サスペンスよりのものも多く、ジャンルによる影響はデータからは見られませんで
したが、唯一、今クールの「愛してたって、秘密はある」の感情スコア値は「哀しみ」が突
出しており、同枠過去放送ドラマの感情スコアと比べると特徴的でした。この感情スコア
値だけではなく、あらゆるデータを複合的、層別に見ることで「リアルタイムでの視聴に
結び付かなかった」視聴者の感情の因果関係を審らかにしていきたいと思います。




上記は外れ値となった対象をご紹介しましたが、同時に、正解したものを検証していく中
で、偶然の結果ではなく、感情スコア値からの予測部分についての精度は概ね高いことが
分かりました。というのも、シリーズものやリバイバルドラマに関しては、今回感情スコ
アのキーとなる、あらすじデータの充実を図り、整備した上で感情スコア値を算出したこ
とが理由としてあげられるかもしれません。その結果、まだ精度改善の余地があるトレン
ド指数や視聴者の期待度などを加味したスコアでのブレを吸収できたと考察できます。
さて、今回予測できたものとできなかったもの、そこの差は何だったのかを明らかにした
ところで、改善ポイントも定まりました。
いくつか課題がある中で、大きく見ると、ひとつ目は、視聴者の期待値とその動向(視聴
者がそのドラマをリアルタイムに楽しむのか、録画などで楽しむのか)を人の感情という
視点から、改めて検証、分析していくことにします。
あわせて、仕掛ける側(テレビ局側)がどのような施策、つまりプロモーション(出演者
の積極的な番宣出演、SNS 先導、訴求ポイントなど)を行ったのかを新たに分類、データ
を追加することで、どのようなターゲット層へリーチし、それがどのように視聴率へ結び
付いたのか、影響を検証していこうと思います。
そして、ふたつ目は、トレンド指数、つまり何が受け入れられ、何が敬遠されるのか。こ
ちらは単体での過去の実績だけで図れる単純なものではなく、複合的な要素や条件との組
み合わせにより変動していくものとして、もしかしたら、潜在指数という位置づけになる
かもしれません。


――――――――――――――――――――――――――――
ヒットドラマの特徴的なキーワードからの考察
――――――――――――――――――――――――――――
さて、上述した通り、今後まだまだ新たな切り口でソケッツ感情分析エンジン(特許出願
中)を活用した分析をしていく必要がありますが、今回は、ドラマのテーマとなるキーワ
ードの“類似度”という軸での分析結果を少しご紹介できればと思います。


こちらは、過去レポート『「表現したい世界観」「なりたいイメージ」が四字熟語でつな
がる?!』と割と近いイメージとなるかもしれません。過去レポートでは、歌詞データを
感情スコア化、さらに感情スコア値の類似性から、歌詞の世界観に類似した情報を、歌詞
とは直接的なつながりのない四字熟語に関連付けた結果をお届けしましたが、今回は、本
対象となるドラマのあらすじデータを元に、特徴的なキーワードとあらすじから算出した
感情スコア値をニューラルネットワーク(※)を活用し、ドラマごとに学習させました。
そして、特定のキーワードから、感情スコア値およびキーワードによる類似度の高いキー
ワードとその類似度スコアを算出しました。
さらに、この結果から、平均視聴率 20%以上を記録したいわゆる“ヒットドラマ”(以下
「ヒットドラマ」)と平均視聴率 20%以下だった“それ以外のドラマ”(以下「それ以外
のドラマ」)で特徴的なキーワードから類似度の高いキーワードを抽出した結果、キーワ
ードによっては、ヒット作とそれ以外で顕著に差がでたものがあり、双方のキーワードを
見比べるとストーリーの傾向がなんとなく想像のつく結果となりました。今回、ほんの一
部ではありますが、3 つほどピックアップしてご紹介したいと思います。
いかがでしょうか。
「不倫」「シングルマザー」「仕事」というキーワードにおいて、ヒットドラマとそれ以
外のドラマで類似度の高いキーワードにかなり差がでました。
オレンジ色がヒットドラマ特有のキーワード、水色がそれ以外のドラマの特有のキーワー
ドとなります。それぞれの特有のキーワードをピックアップしてみていくと、ヒットドラ
マに関しては全体的にポジティブワードが並んでおり、前向きでバイタリティを感じるよ
うなキーワードが並びます。
これらの結果は、今後、ドラマヒット予測での重み付けなどへ活かしていくのと同時に、
ソケッツが目指す、制作支援の実用化に向けて、さらに分析、体系化を進めていく予定で
す。


(※)
ニューラルネットワークとは、人間の脳内にある神経細胞(ニューロン)とそのつながり、
つまり神経回路網を人工ニューロンという数式的なモデルで表現したもので、要は脳神経
系をモデルにした情報処理システムのこと。学習能力を持ち、必要とされる機能を、提示
されるサンプルに基づき自動形成することができ、文字認識や音声認識など、コンピュー
タが苦手とされている処理に対して比較的有効とされている。


――――――――――――――――――――――――――――
2017 年今クールドラマ、最終回視聴率予測
――――――――――――――――――――――――――――
そして、最後は、最終回視聴率予測に戻りたいと思います。
前回、7 勝 2 敗 2 引き分け、正解率 78%となった結果でもお伝えしましたが、外れ値とな
った要因として、以下 2 点について今回チューニングを行いたいと思います。
1.イベント変数の追加
2.ドラマ関心指数の追加


まずひとつめに、スポーツの生中継や特番が同時間帯に放送された影響によるブレを吸収
するためのイベント変数の追加です。こちらは前クールでの事例から、イベント発生時の
影響度を算出、そちらを元に数理モデルに組み込みました。




次に、ドラマに付随した話題性や好感度、またトレンドの共感軸をスコアリングした重み
づけをするなど、ヒット要因となりうるドラマのパワー指数に関してですが、こちらは別
軸で進めている件でもあり、まだこの段階での実装は厳しいと判断し、今回は暫定的に Web
上でのドラマの反響度を関心指数という形で独自にスコア化したものを重み付けとして利
用することとしました。
【最終回視聴率予測モデルプロトタイプ版】
さて、このモデルにて、今クールドラマの最終回視聴率も予測しました。




前回予測での課題を改善し、さらなる前進を遂げられるでしょうか?!


――――――――――――――――――――――――――――
最後に
――――――――――――――――――――――――――――
これまで各ドラマのあらすじデータから感情スコア値を算出、そちらをベースとして付帯
情報などを加味したモデリング、チューニングを行い、視聴率の予測に挑戦してきました
が、言わずもがな、そちらと並行して、ソケッツ感情分析エンジン(特許出願中)での感
情分析も日々加速、進化しています。
その、ほんの一部として“ヒットドラマ”と“それ以外のドラマ”での特徴的なキーワー
ドの類似度の高いワードをご紹介しましたが、このようなあらゆる層別での分析結果が出
揃いはじめ、“視聴率予測”にとどまらない、制作支援やプロモーション支援の実用化に
向けたヒット予測モデルの構築に向けて、今後は少し中期での取り組みとなってきそうで
す。
まずは今までのレポートでも触れてきた抜本的な課題の解決として、
1.感情スコア値をリッチにするためのあらすじデータの充実と品質アップ
2.視聴者の期待値とその動向(視聴者がそのドラマをリアルタイムに楽しむのか、録画
などで楽しむのか)における“感情”の分析とソケッツ感情分析エンジンのバージョ
ンアップ
3.人物(出演者)メタとトレンド指数
4.上記と並行して、分析精度を上げるためのMSDBデータの拡充
大きく、この4つを今まで以上に推進していきたいと思います。
ということで、次回、今回予測の今クール連続ドラマ最終回視聴率の答え合わせとともに、
本シリーズ First season に一旦区切りをつけ、以降は新たに上記の取り組みに合わせて
Second season に突入していきたいと思います。


ソケッツが目指す未来は、もちろん視聴率予測自体にとどまりません。過去の事実情報か
らだけでは予期できないヒット要因を、人の感情をキーとして予測、また、新たな独自指
標の構築などにも取り組んでいきたいと思います。今後もソケッツの挑戦にご期待くださ
い。


「ソケッツレポート」の記事のご利用、また共同研究などに関するご相談はこちらのお問
い合わせフォームよりご連絡ください。
http://www.sockets.co.jp/inquiry/contact/policy.html




●公開日

平成 29 年9月1日(金)

●ソケッツレポート

2017 年連続ドラマ視聴率を予測する シリーズ第4回

http://www.sockets.co.jp/kansei/kansei_report06.html



株式会社ソケッツ:
(http://www.sockets.co.jp/)
株式会社ソケッツは、平成12年6月に設立された「人の気持ちをつなぐ」という事業目
的を持ったデータベースサービス会社です。現在、KDDI株式会社、株式会社NTTド
コモ、カルチュア・コンビニエンス・クラブ株式会社などへの音楽や映像、書籍などを中
心とした検索・レコメンド・ストリーミング・データ提供・アナリティクスなどのデータ
関連サービスを行っております。


本リリースに関するお問い合わせ先:
株式会社ソケッツ
〒151-0051 東京都渋谷区千駄ヶ谷4-23-5JPR 千駄ヶ谷ビル3F
担当:コーポレート本部 小田嶋
Tel:03-5785-5518 Fax:03-5785-5517
E-mail:ir@sockets.co.jp
以上

19882