見出し画像

「分析と可視化の未来」Takram 櫻井稔×データビークル 西内啓

デザイン・イノベーション・ファームTakramのメンバーがデザイン・テクノロジー・ビジネス・文学などの話題を幅広く展開するポッドキャスト「Takram Cast」。Takramのディレクター櫻井さんとデータビークルの西内啓が「データとデザイン」について3回にわたり語りあったセッションの書きおこしです。第3回目は、分析と可視化の未来について、これまでのお話を振り返りながら考察します。(まとめ・文責/編集部)
シティズンデータサイエンスラボは「データサイエンスを全ての人に」を掲げる株式会社データビークル(https://www.dtvcl.com/)が運営する公式noteです。

「見える化」「言える化」に続くのは「信じる化」?

櫻井 第3回目は、「分析と可視化の未来」というテーマでお送りします。これまでお話してきたデータ分析や可視化について、それぞれの立場から、これからどうなっていくのかを考察していきたいと思います。

西内 第1回目で探索的データ分析のビジュアライゼーションについて触れた時に、多次元の情報を人の顔の形で表現した手法はあるが、それを使っている人は見たことがないということをお話ししました。

実は我々のような統計の専門家がグラフを使うことは限られています。なぜかというと、一つの調査において、調査項目だけで2〜30項目ぐらいが並ぶんですね。すべてをいちいちグラフにしていたら、それだけでページ数がなくなってしまいます。

そこで大きく一枚の表(テーブル)2、3枚ぐらいにまとめるんです。1枚目に調査対象者や、数字であれば平均値だとか標準偏差とかを出して全体像を把握します。

2枚目には分析結果を表であらわします。たとえば所得や失業率、教育の達成度のように最大化したいものや最小化したいものがあって、それらが組み合わせの中でどう相関しているのかという多変量解析した結果と、それが偶然の範囲と言えるのかどうかについて検証したものが並べられていて、論文中の結果で中心になるのはこの2枚の表というパターンが少なくありません。

だから多くの統計解析や先行研究にはグラフは出てこないんです。それでも専門家同士は「これとこれが関係していたんだね」と、その結果を信じて政策を考えていきましょう、となる。これが統計学を分かってる人側の感覚なんですが、……まぁこれでは人は動きませんよね。

統計学の専門家以外の人たちにとっては、それが何を意味しているかというイメージがつきません。そこをグラフに落とし込んでうまく視覚化することができれば、「なるほど、これはこういうことか」という、前回言った「見える化」でも「言える化」でもなくて、いわば「信じる化」というような別の効果が生まれます。

櫻井 また新しい概念ですね。「信じる化」。

西内 そうした意味で、櫻井さんと一緒に仕事をしていて、ビジュアルのパワーは強いなと感じています。

自分の中に「プロの素人」を持つ

櫻井 そうですね。僕らはいろいろな仕事をやっているんですが、以前、日本科学未来館の科学コミュニケーター(同施設の職員で科学者や技術者と一般の方々をつなげる役割を持つ)の方と一緒に、電子書籍をつくるプロジェクトに参画したことがあります。科学コミュニケーターと呼ばれる人の複雑な話を一生懸命聞いて、それをわかりやすくまとめるという、翻訳家のような仕事でした。

それで、西内くんとはじめて一緒に取り組んだ仕事の時も、その科学コミュニケーターの仕事と同じようなマインドセットだったなと思うんです。データ分析を世の中にどう発信していくのか。統計の素人である人たちにツールを使ってもらうことができるのか。僕たちは仕事をする時に、「自分の中にプロの素人を持て」ということを考えています。僕の中にいる素人に「dataDiverのこのボタンの意味はわかる?」とたずねながら仕事をしていました。見える化をするためには、まずはちゃんと素人がわからないといけないということを考え続けていたのが記憶にありますね。

データがデザインと一緒にならなければいけないという理由は、まさにそこにあると思っていて、「データの民主化」や「データサイエンスをすべての人の手に」というような話をするときに、すべての人が今西内くんがいったようなテーブル(表)を見て、「なるほどね」と思うかというと、だいぶ距離がある。

「現場の方に触ってもらいたい」という強い思い

櫻井 今後のデータサイエンスに重要なことは、先ほど述べた科学コミュニケーターの例のように、複雑な話を素人の方にも「なるほど」と思ってもらえる状態にすることだと感じています。そうすると、情報整理という意味でもデザインされなければいけません。サイエンティストや統計家の言葉をデザイナーが聞いて、それを理解できる言葉に翻訳し、専門家とユーザーの間にあるデスバレーをお互いが渡れるようにするということが、私がデータに対して強く感じているところです。

西内 櫻井くんと一緒に仕事をしているときには、ユーザーのメンタルモデルというお話をよくしますよね。5年前に弊社が創業したときとは状況が変わってきて、近頃では我々をまねた製品が世の中に出てきているんですよ。しかし、一応頑張って従来のBIツールよりおしゃれというか、キレイにはしてるんだけど、細かいところを見ていくと、それらの製品はユーザーのメンタルモデルが分かっていないのではないかと感じることがあります。

櫻井 dataDiverが今までの分析ツールと大きく異なる点は、現場の方に触ってもらいたいという強い思いがあったことですよね。トヨタの例をよく覚えています。

西内 統計的品質管理の7つ道具(※)ですね。

※統計的品質管理の7つ道具:統計的品質管理の基本として位置づけられている7つの手法のこと。具体的には、チェックシート、パレート図、管理図/グラフ、ヒストグラム、特性要因図、散布図、層別である。

あの頃から日本の企業ではグラフの使い方が一挙に普及したらしいんですよ。それぞれこういう状況ではこういうグラフを使うべきであるという定義が明確に7つまで落とし込まれたことで、読み書きそろばんができる人であれば、IT がなくても自分たちでなんとか方眼紙にグラフを描けるようになった。そしてグラフにした結果、何が起きているかという問題を現場の人がチェックできるようになりました。

櫻井 そのときに、すごい、なるほど、と思ったのが、工場などの現場の方がグラフの変化を見たときに「この日は佐藤が欠勤した日だ」というようなことがわかるという話です。だけどそれは(現場にいない人には)絶対に分かりません。現場にデータサイエンスが入ることがいかに重要かということなんだと思います。

dataDiverの開発当時は、酒を飲みながら熱い思いを語り合っていたんだけど、この「現場の佐藤さんが休んだからこのグラフはこうなっとるんや」みたいな事がちゃんと現場でわかるというのが、まさにdataDiverなどの分析ツールを現場に入れることの一番中心となる価値なんでしょう。

次の問いは、その時に現場で使える分析ツールとは一体何かということですね。

dataDiverの開発のときには「現場の人が分かるものとは何か」「現場の人が使うとはどういうことか」「現場でわかるグラフはどこまでか」など、現場の○○とは何か」ということを自分の中で問いました。そうすると、「火曜日にDMを送るといくら儲かる」といった自然言語で伝えたり、そもそも入力欄を減らすといったことも一つなのかも知れないなと思いました。

目的地を見失わないため、常に「月」が見えるように

櫻井 まず使う人が「一体自分たちは何をやろうとしているのか」という目的を常に見えるようにしておくことが大切ですね。dataDiverを開発していた当時、月夜の晩に林の中を歩く時、目的地を見失わないように常に月が見えるようにしておこうというストーリー性豊かな話をしていましたよね。

西内 あれは、富士の樹海で迷子になるのはなぜかという話ですね。人間は無意識のうちに向かう方向に偏りが出るんですよ。森を歩いていると、目の前の木を右によけたり、左によけたりしなければならなくて、自分なりにまっすぐ歩いているつもりでも、無意識のうちに左右が偏ってしまうんです。一般的には左に偏る傾向があるそうで、どれだけ気をつけていても、左方向に大きな丸を描いて元の場所に戻ってきてしまう。

では、迷子にならないように探検家の人たちはどうしているのかというと、月でも星でもいいから遠くにあるものを目印にするんです。ゴールを見失わないようにしていれば、右によけようが左によけようが、いつか森を抜けられる。

BIツールを使った分析においても、最終的に俺は一体何をしてるんだって迷子になってしまうようなことが起きています。深入りしすぎてゴールからかけ離れてるし、これって何の役に立つんだみたいなグラフがたくさんできていたりする。

櫻井 dataDiverは、ステップが1から3まであって、ステップ1で「何をやるか」という目的をプルダウンで入力しますが、ここで選んだ目的がステップ2でもステップ3でも必ず表示されるように設計しました。

data”Diver”(ダイバー)という名前ですから、ダイビング中海にどんどん潜っている途中で、綺麗な魚に出会ってもそちらに向かって行ってしまわないように設計しておこうという設計思想で、まさにそれこそがデザインだったと思います。

このdataDiverの制作が僕たちが一緒に取り組んだ初めてのプロジェクトだったんですが、ここに来てガートナーが拡張アナリティクスや市民データサイエンスを定義するなどの流れが出てきています。

あらためて、西内くんはこれから分析と可視化はどうなっていくべきと考えますか?

西内 dataDiverはどちらかというと「言える化」側からスタートしていると思うんです。目的を設定すれば分析結果を日本語で教えてくれて、気になった部分を見える化できるツールです。こうした分析結果が見えるという部分に加え、目的の設定もビジュアル側からできるということが次のフェーズではないかと思っています。それを当然「見える」だけでなく「言える」までセットでできるということがさらにその次のフェーズかなと考えますね。

オフラインの商売はいまだ空間から自由になれない

櫻井 最近私たちが一緒に回してきたいくつかのプロジェクトの中でも、可能性がチラッと見えてきましたね。

西内 そうなんです。Takramに集まるデータは空間情報が多いじゃないですか。例えば「この辺に来ている人」というデータを言語化することは結構難しいんですね。プログラムが書ける人であれば、「24時間以内の移動経路について半径ここまでの場所に入っている人」というようなコードを書いてフラグを立てれば分析できるんですが、「なんとなくこのあたり」というのは地図を見ながら話をするしかありません。しかし、日常的にやっている人も多い話です。

そうした分析を簡単にできるツールをつくったとして、分析結果が出た時に、現在のdataDiverは散布図や棒グラフのようなシンプルなグラフに落とし込んでいますが、もっとリッチに可視化できるものがあってもいいのではないかと考えて、今回かっこいいものをつくりました。

櫻井 そうですね。どうしたら現場にデータサイエンスや分析結果が落ちていくだろうという問いに対して、一つの結論としては次のように言えると思います。私たちの営みのすべては基本的に空間上に存在していて、その空間上で起こったことが分析結果として空間上に表示されるということがメンタルモデルに一番近いのではないか。

これまでやってきた見える化することに近いのかも知れませんが、それとは一次元違うところに存在しているんですよ。ただの地図上の可視化ではなく、その上でどのようなことが起きているのかを言える化する。アクションに起こせる状態で実空間上にマッピングされるということのパワーは、とても強く感じるところですね。

西内 もう1つの観点として、今後dataDiverに「予測」という機能が本格的に搭載されます。これは結構おもしろくて、過去の購買履歴からある顧客がいくらぐらい買ってくれるポテンシャルがあるか予測するといったことができるんですね。機械学習の技術として、プログラムを書いて予測値を正確に当てるということが仕事として成り立っていますが、dataDiverではそうしたデータサイエンティストがやっていることの8割ぐらいは民主化できるのではないかと考えています。

それで、お客様の個人情報は法人でも個人でも住所まで入っていますが、住所はまさに空間情報なのですよね。「この辺にお店を出した方がいい」「交通広告はこの辺に出そう」「営業マンが回るとしたらこのエリアだ」といったオフラインな商売については、人間はまだ空間から自由になれないんですね。ここを最終的な予測値として空間に落とし込むようなユーザーインターフェイスや見せ方がこれから主流になっていくのではないかという気がしています。

櫻井 今後、あらためて地図上で何ができるのかというのは、一つの課題かなと思っています。9月20日に開催するイベントでも、地図上での可視化ではなく、地図上での分析とは一体何かというところが大きなトピックになりそうですね。

西内 そうですね。統計学側ではフロンティアな部分もあって、例えばお客様ごとに何か分析をする場合、Aさんと B さんが友達かどうかという情報は EC サイトではつかむことができません。Aさんと B さんの購買行動が似ているというデータが仮にあったとしても、そうした情報が分からない状態で分析しているんですね。しかし、隣り合った空間ということであれば、温度も人口も似ていることが分かっています。

今ようやくエリアごとの空間的な情報が扱えるだけのケイパビリティがIT側で出てきたので、この分野は今後熱いと思います。

今度まるまる一冊メッシュ統計(※)の新刊が発売されたそうなんですが、そういう本がこの時期に新刊として出るというのは、時代の変化なのではないかなと。空間的な部分のデータ分析は今後オフラインの世界にデータを活かしていく上で、とても熱い分野なんじゃないかなと思います。

※メッシュ統計:地域メッシュ統計のこと。緯度・経度に基づき地域を隙間なく網の目(メッシュ)の区域に分けて、それぞれの区域に関する統計データを編成したもの。

櫻井 9月20日のイベントでは、ここら辺の話をぜひプロジェクタで映しながらお話ししたいと思います。

ということでこの「データとデザイン」3回シリーズでTakram櫻井とデータビークル西内がお送りしました。ありがとうございました。

(了)

みんなにも読んでほしいですか?

オススメした記事はフォロワーのタイムラインに表示されます!