第13回予測モデルとAIの使い分け

2019年7月26日 08:53

シティズンデータサイエンスラボは「データサイエンスを全ての人に」を掲げる株式会社データビークル(https://www.dtvcl.com/)が運営する公式noteです。

正確な予測が価値を生むとき

まずリサーチデザインを応用して、予測モデルやAI開発の課題設定について考えてみましょう。予測モデルとは統計手法や機械学習手法を使って「とにかく正確に何かの値を予測してその結果を出力するもの」と述べました。一方AIについては「予測に基づき、最適な選択肢を提示する」ものと述べました。

いずれにしても、対象ごとの目的変数を正確に予測することは価値につながります。株や不動産、原油などの価格が今後どうなるか、人間より正確に予測できるようになった人は大金持ちになれるでしょう。売上やキャッシュなどの経営指標が今後どうなるか正確に予測できる人は、会社のリソースを限界まで使って、効率的な経営をすることができます。スポーツチームはドラフトやフリーエージェントから獲得可能な選手のうち、長期的に見て、誰がどれぐらい活躍できるかをうまく予測できると、年俸を抑えた上で勝利を重ねることができます。大災害が起こるかどうかを正確に予測すれば、被害を抑えて人命が救われます。盤面上のどの場所に石や駒を置けば勝率が高いかを、誰よりも正確に予測すれば囲碁や将棋でも勝つことができます。

これらは「予測の正確さ」、つまり人間が直感的に行なうよりも正確な予測ができるという「予測精度の改善価値」が重要になるパターンです。一方で、人間より精度の低い予測であっても、予測モデルやAIが価値を生むパターンはあります。それは「手間の省力化」という側面です。

省力化というもう1つの価値

Amazonのページを開くと、そこに自分におすすめの商品が表示されます。この仕組みの背後でも機械学習手法が応用されています。何の商品を表示すべきかという「最適な選択肢」を提示していると考えればこれも一種のAIと考えることができます。すなわち、書店員や図書館の司書、あるいは本好きの友人に対して「こういう本が好きで何か他にも読んでみたいんですけど、何かおすすめはありますか?」と聞いて教えてもらうという人間の行為を、人工的に代替したものだと考えてもそう間違いはないでしょう。

このAmazonのおすすめが人間より正確かというと、必ずしもそうではありません。自分と相性のよい書店員が働くお店では、いつも行くコーナーにAmazonでは見つからなかった本との出会いが存在します。

一方、Amazonは執拗に私に対して、拙著の『統計学が最強の学問である』を推薦してきます。確かに私は、統計学や機械学習の手法や応用例について書かれた本を大量に買っているので、データ上「あれだけ売れた類書をまだ買っていない」と判断されるのはよくわかりますが。

しかし、よい書店員や司書、友人の時間は無限ではありません。世界中のAmazonの全ユーザーに対して、いつでもどこでも24時間電話一本ですぐに「こういう本が好きなんだけどおすすめはありますか？」と質問できるコンシェルジュサービスを提供しようとすれば、おそらくあのAmazonですらすぐに吹き飛ぶほどのコストがかかってしまうことでしょう。「人間がよく考えた結果」より多少精度が低かろうと、一度きちんと仕組みを作ってしまえば、ごくわずかなコストで自動的に人間の仕事を代替できるというのは確かにビジネス的な魅力です。

２つの価値のトレードオフ

データ分析においては、とにかくアウトカムが長期的な利益に直結するものでなければならない、と述べましたが、予測モデルとAIの価値はこのような２つの価値の掛け合わせで決まってきます。また両者の間にはある程度のトレードオフが存在しています。

予測精度の改善自体が大きな価値を生むのは、たった1つの予測に基づいて、大金が動くようなもの、大量の人命がかかっているようなものごとです。このような仕事は人類全体で見ればごくわずかな一部の専門家が行なうものであり、また専門家であったとしても仕事時間のすべてを予測だけに費やしているとは限りません。したがってこうした予測をAIで自動化したとしても、省力化のメリットは大きくないかもしれません。極端な話、「大地震を正確に予測する」というのは日本人にとって大きな価値になりますが、地震を研究する学者が自分たちの省力化になるからとお金を払ってこのAIを買ってくれることはないでしょう。

「予測精度の改善価値」があまりに高すぎるような課題では、「人間よりもかなり精度が下がるけど省力化につながるからよい」といった判断はしにくくなります。日本において、救急車を呼ぶべきかどうか電話で相談する窓口を設けている自治体は少なくありません。この窓口の業務をAI化するには、人命に関わる「予測精度の改善価値」が大きすぎるために、人間と同等以上の予測精度が得られないのであればその導入に対して慎重にならざるを得ないでしょう。

逆にいえば、「予測精度の改善価値」がそれほど高くない課題であれば、精度が下がったとしても、省力化ができるというだけで価値になります。先ほどの「何の本をおすすめすれば相手は喜んで購入するか」という確率を、Amazonのレコメンドエンジンは熟練した書店員ほどには正確に予測できない、という話を思い出しましょう。このような課題は多少精度が下がったとしても大きな問題になることはありません。社会の中には、専門家として、正確な予測をしなければならない課題だけでなく、日常的に「多少精度が下がっても問題にはならないが、社会全体では大量の時間や手間がかかる課題」というものがたくさん存在しています。社会全体に存在する「大量の時間や手間」のことを私たちは「課題の総負荷量」と呼んでいます。

予測モデルかAIか

実は統計学や機械学習を、主に「予測精度の改善価値」のために使うか、「課題の総負荷量」の低減のために使うか、という目的に応じて、同じアルゴリズムでも予測モデルとして使うか、AIとして使うかという使い分けを考えることができます。

正確な予測値自体が価値を持ち、それが得られれば十分である、というのであれば、予測モデルを作ればよいでしょう。こうした課題は、「自動化」されることが必ずしも望ましいものではありません。

製造業の中で、特定の製品の需要を正確に予測し、生産計画を立てるという課題について考えてみましょう。需要を正確に予測することで在庫やキャッシュフローのムダを省くことができますので、予測精度の改善価値があることは間違いありません。課題の総負荷量という点ではどうでしょうか？専門スタッフでも、毎日、需要予測だけを考えているわけではないので、自動化して省ける人件費などたかがしれています。さらに自動化することで「たまたま機械学習が大きく予測を外す」という状況になった時のリスクをコントロールしたり、責任を取ったりすることができなくなってしまいます。とすれば、正確でかつ専門スタッフにとり、使いやすい予測モデルを作り、管理できるようなツールの方がAIよりも役に立つはずです。

同じ製造業の仕事であっても、原材料を仕分ける、製品を指示通りに箱や袋に詰める、シールやタグを貼る、そのミスをチェックするという作業について、大量のアルバイトの人海戦術で乗り切っている工場もまだまだたくさんあります。こうした作業の精度は１、２%程度、人間が行うよりも低かったとしても、大した問題にはなりませんが、課題の総負荷量は世界レベルで見れば大きなものになるでしょう。つまり、もし「人間と比べてそう悪くない」という精度でこうした課題を自動化できるのだとすれば、それは大きな価値を生むということです。

あるいは総負荷量の高い課題は、オフィスや工場といった仕事の場だけに存在しているわけではありません。家庭でも、夕食の献立を考えて買い物をしたり、ゴミを分別したりといった、「多少精度が悪くてもそれほど問題にならないが、世界全体では大きな時間がかかっていること」はたくさんあります。こうした課題を解決するAI製品の開発に成功すれば、大きな付加価値を持つ商品として世界中でヒットするかもしれません。

皆さんにとって、あるいは皆さんの顧客にとって懸念となるのはどちらのタイプの課題でしょうか？これらの使い道を間違えないように是非よく考えてみましょう。