第17回 AI開発における適切な課題設定とは（2）

2019年11月14日 10:52

シティズンデータサイエンスラボは「データサイエンスを全ての人に」を掲げる株式会社データビークル(https://www.dtvcl.com/)が運営する公式noteです。

総負荷量とトレードオフになる安定性と有効性

このように総負荷量という考え方を持って「どれだけの煩わしさを解決できるか」「もっと範囲を広げて考えられないか」というのはAIの課題設定を行う上で最初に検討すべき重要な視点です。しかし総負荷量が大きくなるようにとにかく範囲を広げさえすればよい、というわけでもないのが難しいところです。

なぜなら課題の範囲を広げれば広げるほど「安定性」が減少する傾向にあります。予測モデルの時にも言及しましたが、機械学習とは「このデータが得られた状態がずっと続くとして・・・」という仮定を置いた上で予測を行うものです。この仮定が崩れるのなら予測が正確に当たるかは保証されず、AIが出してくる「最適な」はずの選択がナンセンスなものになる可能性があります。

実は、囲碁や将棋のAIが成功したのには、この「安定性の高さ」が関係しています。大不況が訪れようが、近くで災害が起ころうが、革命的なテクノロジーが発見されようが、囲碁や将棋のルールが変わることはありません。これが「安定」ということです。

しかし予測モデルのところで、アパレルやエンターテイメントに関する予測については「流行りすたりの影響で予測モデルが機能しなくなることもある」と述べました。これはAIについても同様で、何のメンテナンスもしなければ、「AIが服装をコーディネイトしてくれる」とか「AIがBGMを選曲してくれる」といった仕組みはいつの間にか「微妙に古臭い」というものになってしまうかもしれません。そのような事態を防ぐためには継続的にコストをかける必要があります。

課題の範囲を広げすぎると、安定性以外に有効性の問題が生じることがあります。私たちがAIについて、有効性が低いと表現するとき、それは選択肢の組み合わせが膨大すぎて、その多くがまったく意味をなさないとか、害になってしまうという状態を指します。

すでに述べたように「ロゴデザインをする」というAIサービスを提供している会社は複数あります。広告関係の仕事でも、「コピーを書く」というAIはすでに電通や博報堂などにおいて、ある程度の実績が出ています。これらは、「単語数個程度」や「フォント・アイコン・配置」といった有限な要素の組み合わせの形で表現できるものです。また、最低限の作法さえおさえれば「まったく意味をなさない」とか「害悪になる」ということもそれほどありません。

これが「15秒のコマーシャルフィルムを制作する」となるとそのリソースの組み合わせは膨大な数になります。単純なデジタルデータとして考えても、１画面の画素数×フレームレート×15秒分というとんでもない画素の組み合わせになり、それで組み合わされたもののほとんどはノイズのようなものにしかなりません。また、要素を還元して、絵コンテであるとか、その背景の舞台であるとか、セリフ、登場するキャラクター、全体的な色調といったものを考えたとすれば、やはりその組み合わせはとんでもない膨大なものになってしまいます。その多くは「意味不明な場所で意味不明なキャラクターが意味不明なことを話す」という二日酔いの時に見る夢のような内容になってしまうことでしょう。

「15秒のコマーシャルフィルム」でさえこのような状態なのに、これを「この世のすべての動画コンテンツ」の範囲に広げてしまえば、総負荷量こそ大きくなるかもしれませんが、AIの開発の手間やコストは数倍どころでは済まないはずです。

同様に、「ゴミ捨て」という単純なタスクでも、この世のすべての範囲に拡張しようとすれば、鉛やカドミウムなどの重金属を含む化学系廃棄物や、病原菌に汚染されている可能性のある医療廃棄物なども含んでしまいます。世の中には私たちが今まで人生で一度も見たことのないような「ゴミ」がいくらでもありますが、それらをすべて正確かつ有害とならないように分別するのはたいへんな困難を伴います。

これを「ホワイトカラーのオフィスで出るゴミの分別」と限定すればどうでしょうか？こうしたオフィスで出るゴミのほとんどは燃えるもので、それ以外にはせいぜい食べ物や飲み物の空き容器ぐらいのものです。重金属や病原菌の心配をする必要はほとんどありませんし、家庭と比べても、スプレー缶や包丁といった危険で捨てにくいものが出る可能性はまれにしかありません。しかしそうした絞り込みを行ってなお「オフィスでのごみの分別」タスクはそれなりに大きな総負荷量を持っています。安定性という観点でいっても、オフィスでゴミを分別するタスクのコツが、アパレルや音楽の流行ほど急激に変化することはありません。

このように、いったん総負荷量が大きくなるよう範囲を広げたあと、逆に「総負荷量はかなり大きいまま、安定性および有効性を大きく向上させるようにできないか」という絞り込みを考えるのも大事なコツです。

責任性や感情性がある課題は人間と組み合わせたシステムを

あと2点、責任性と感情性という考え方についてもチェックしてみましょう。囲碁や将棋に勝つか負けるかというのは、本人はともかく社会的にそれほど大きな問題にはなりません。これが課題の「責任性が低い」ということです。しかし、誰かの生命や名誉、自由といった、お金だけでは済まないようなものを対象とするAIについてはその責任について注意が必要です。

予測精度の改善価値と総負荷量のトレードオフのところで言及した「救急車を呼ぶべきかどうか」という課題も責任性が高い課題の一つです。司法や防犯といった領域で、判断を間違えた場合に冤罪や風評被害を生んでしまうようなAIもそうでしょう。以前Amazonが、人材採用の判断を行なうAIを「差別を助長する」という危険性から廃止しましたが、こうした判断も責任性の問題と考えられるかもしれません。

もう一方の感情性とは、「人間がやるからこそうれしい」ところです。温泉宿に行った際、女将さんとの会話はそれほどバリエーションがあるわけではありません。また、出張先で見つけたお店のバーテンダーの会話もそれほどバリエーションがあるわけではありません。したがって、カメラから読み取った自分の画像から「お疲れたまってらっしゃいますか？」「今日はこの近くでお仕事ですか？」といった会話内容のうち、どのようなものを提示すべきかということをAIに考えさせることはできます。しかし、AIが代わりにこうした会話をやってくれたからといってちっともうれしくありません。

このように責任性と感情性が高い課題では、AI単体ですべてを解決せずに、責任を取ったり感情を表現できたりする人間と組み合わせた仕組みの設計がおすすめです。AIと人間をうまく組み合わせれば、高精度で効率的に業務を果たすことができることでしょう。つまり、責任性が高い課題であればAIが自動的に何かを行うのではなく、専門家に正確な予測値や判断のために必要な情報などをわかりやすいインターフェースで伝えるという方法があります。あるいは感情性でいえば、顧客にはわからないように接客スタッフの手元の端末やイヤホンなどに「相手はこの話をすると喜ぶ」という情報を表示してみてもよいかもしれません。人間の記憶力や判断スピードをAIが補ってくれれば、省力化しながら満足度の高い接客を実現できる可能性もあります。

これだけのことがわかっていれば「何にAIを使っていいかわからない」とか「AIを作ってみたけどマネタイズがうまくいかない」といった事態はだいぶ避けやすくなるはずです。皆さんも是非ご自身のアイデアと機械学習技術を活かして、世界から「負荷」を減らしてみてください。