AdobeStock_178898282-_更新済み_

データ分析で成功を収めたNetflixのドラマ「House of Cards」【Tokyo Data Science Lab 2018 基調講演書き起こし vol.4】

シティズンデータサイエンスラボは「データサイエンスを全ての人に」を掲げる株式会社データビークル(https://www.dtvcl.com/)が運営する公式noteです。

データ分析のROIは実に13倍

会社でデータ分析に取り組もうとすると、データを分析して実際どれくらい儲かるのという話が出ると思います。誰かにそれを聞かれたら「ROIは13倍です」と答えてください。1,000万円ぐらいデータ分析に使えば1億3,000万円が戻ってくるわけです。もしこれぐらいのメリットが享受できなかったとすると、自社には何か組織的な問題があるのではないかと考えたほうがいいかもしれません。

最近は、あまりエビデンスを使っていなさそうな領域でもエビデンス活用され、それがビジネスの成功につながるという事例が出てきました。

画像1

みなさんの中に、『House of Cards』というNetflixのドラマを見たことがある方はいますか?Netflixは、それぞれのコンテンツについて、監督や制作、出演者などを細かく分類しています。また、動画のカテゴリも、たとえば恋愛の中でも「シンデレラストーリー」というタグがあったり、「許されぬ恋」など、1つのジャンルの中でも細かく分かれていて、あるユーザがどこで一時停止を押したか、どこをスキップしたか、などのデータを蓄積していることで知られています。

このデータから、自分たちがこれから狙うべき顧客層を分析したところ、「BBCが制作した堅いドラマが好き」という層が見つかったそうです。ほかにも、好きな映画監督や出演者などをデータ分析から導き出し、それを全部詰め込んで『House of Cards』というコンテンツを作ったところ、とてもヒットして、おそらくROIが13倍どころではない投資効果を生んでいるはずです。

今まで「経験と勘とセンス」でつくられていたクリエイティブな世界も、データを使えばきちんと成功をするという話です。これは氷山の一角ですので、みなさんの仕事の中でもきちんと活用していただければ、13倍以上のリターンが得られるのではないかと我々は信じております。

データサイエンスをすべての人に

AIを使って、仕事を全部機械に任せるようにしましょうというのも1つのデータサイエンスのかたちですが、我々が支援したいのは、ビジネスの意志決定やビジネスに対する洞察ですね。そういったものをサポートするためのデータサイエンスを大事にしていきたいと考えております。

先ほどの話で、多変量解析はどうしたらいいのか、p値を計算しろというけれども、統計の勉強をするのは大変だと思われる方もいらっしゃるかもしれません。きちんとデータを蓄積していただいているのであれば、それを簡単にしますというのが我々の仕事です。

画像2

こちらは弊社がはじめに製品化したdataDiverというツールで、多変量解析を自動で行うというものです。BIツールで試行錯誤しないと見つからなかったような、「他の要因の影響」を考慮しなければならない分析が、誰でも簡単にできます。

画面に「クリアさ」と書いているのが「p値」の解釈です。統計学者、あるいは専門家たちのあいだでは、p値が5%を下回っていると慣例的に「たまたまの誤差」だけで出てきた結果ではないという目安にされるのですが、このdataDiverでは「クリア」と表現しています。データサイエンスの専門家の方でなくても「クリアでなければもう少しデータを集めたほうがいいのかな」、「今の時点では結論を下しにくいのかな」ということがわかる仕組みです。

画像3

ガートナー(業界最大規模のICTアドバイザリー企業)も、図にあるハイプサイクルという図で、今後このような技術がどんどん必要とされていくのではないかと言及しています。図の中にある「市民データサイエンス」(シティズンデータサイエンス)がそれです。(※ハイプサイクル…特定の技術の成熟度、採用度、社会への適用度を示す図のこと)

我々はシティズンデータサイエンスを、専門家でなくてもデータサイエンスやデータ分析、機械学習の技術を使いこなせるようにする技術であると考えています。実はガートナーは、これから2〜5年ぐらいのあいだに、AIよりもシティズンデータサイエンスが早く普及するでしょうと言っています。

それは我々の実感ともあっていて、現在、とても多くの引き合いをいただいているところです。恐らくこれから2〜5年にかけて、本格的な普及に向けて世の中が動いていっているのかなと感じております。

我々のdataDiverは、これまで製品としてのジャンルが存在していませんでした。「BIツール」とも、SASやSPSSなどの「統計解析ツール」ともかぶらないんです。そこに最近ガートナーが「拡張アナリティクスツール」という名前をつけてくれたんです。このツールを使えば、データサイエンティストでなくても一般のビジネスマン、あるいは行政の人たちがデータサイエンスを使いこなせるようになる。そして意志決定を最適なものにして、洞察を得るプロセスを自動化するのがこの拡張アナリティクスツールです。

それともう1つ、データプレパレーションというジャンルが新しく注目されています。(分析に必要とされるさまざまな非定型データを収集・整形し、迅速な分析開始のためのサポートをすること)、我々のdataFerryは、まさにこのデータプレパレーションツールであったということに最近気がつきました。

弊社は今回ロゴマークを刷新しました。このロゴマークは、複数のデータを掛け合わせたところに新しい価値が生まれるということを意味しています。

画像4

それは、社内にある複数のデータかも知れませんし、あるいは外部にあるデータかも知れません。そういったものを掛け合わせたところに、弊社がダイヤモンドのような価値を提供させていただければと考えています。

(談・文責:編集部)