「メーカーや卸売業も一体となったデータ活用で付加価値をあげていく」トライアルカンパニー 西川晋二氏×西内啓対談 Vol.2
西内啓の対談シリーズ。トライアルカンパニー 西川晋二さんの第2回目です。西川さんは小売業におけるデータ活用について、小売業だけでは限界があるので、メーカーや卸売業とのコラボレーションが必要と語ります。
シティズンデータサイエンスラボは「データサイエンスを全ての人に」を掲げる株式会社データビークル(https://www.dtvcl.com/)が運営する公式noteです。
店舗運営に直結する、毎時のデータ処理を実現する基幹システム
西内 自社内でデータ分析基盤を内製してこられたんですね。
西川 そうです。でもある時、我々の技術力では従来型のリレーショナルデータベースのチューニングや、複雑で高度なシステムを組むことは難しいという判断に至ったんですね。そこで、一般的なデータベースではない方法に転換しました。
西内 No SQLのようなものでしょうか?とはいえデータを取り出す場合は、 SQL のようなクエリを書いて行うのですか?
西川 もともと当社は「ユニケージ」という開発手法を採用していました。これはLinux のサーバ上で、C言語などを用いて作られた特殊な処理コマンドをシェルスクリプトによって操作し、テキストファイルに保存されたデータをバッチで処理するというものです。マルチコアCPUの性能を最大限にまで引き出し、大量のデータ処理に適した方法とされています。
しかし、ある時期からこの方法でもわれわれのデータの規模だと限界があるという判断をしまして、さらに自社製のデータ処理方法を一から作り直したんですよね。
西内 だいぶ手を入れていますね。
西川 そうですね。われわれが使うような ID-POS データは膨大なトランザクションを処理します。例えば「自動発注をする」「毎時の売上結果を見る」がゴールとすると、「全店舗の売上を毎時処理して、全店舗の理論在庫を毎時計算する」ことが必要です。
それを大手のERP でやろうとしたら、データのサイズが大きすぎてできなかったんですね。そこで、新しいシステムをベースに基幹をつくろうということで、現在の基幹のバッチ処理と分析処理ができあがったところです。
西内 現場で毎時の売上が把握できることによって、どのようなことが変わりましたか?
西川 たとえば自動発注のロジックをより精緻に組むことができるようになり、精度が上がりました。また、各店舗でプロモーションを実施しているときに、途中経過を見ることができるようになったのは意味があると考えています。
西内 普段の日でもある商品の午前中の売上げが芳しくないから値下げをしようとか、売れ行きがいい商品の品切れに注意しよう、という動きにもつながりますね。
西川 そういうこともできますね。「今どうなんだろう」と思った時に、タイムリーに状況が見えるというのは小売業においては非常に重要です。
メーカーや卸売業も一体となったデータ活用で付加価値をあげていく
西内 先ほど、「予測」や「最適化」という、今現在のデータだけでなく未来のことも考えたデータサイエンスに取り組まれているというお話でしたが、それは今どのような感じで進められているのでしょうか?
西川 予測には過去のデータが必要になります。よくあるのは過去12カ月ではなくて13か月分のデータを見て、来月を予測する、という方法です。その際に曜日の整合性を見るとか、プロモーションのイベントによる上振れを修正するようなことを当社では行っています。自動発注のための需要予測は、まだ属人的ではあるのですが、専門チームが対応しているという状況です。
まだ誰もが同じ精度でデータ分析ができるという状況ではありませんので、誰が見ても分かるように整理して、継承していけるようにブラッシュアップしていきたいですね。
弊社はGIS(※)も自前でやっています。100mメッシュの地図上にPOSデータや統計的に加工した需要のデータ、それと国勢調査をベースにしたデモグラフィックデータ(※)や、場所ごとの特徴付けを行うデータなどを紐づけて、新しい店舗を出店する場所の選定に活用したりしています。
※GIS:地理情報システム。Geographic Information System。地理的位置を手がかりに、位置に関する情報を持ったデータ(空間データ)を総合的に管理・加工し、視覚的に表示し、高度な分析や迅速な判断を可能にする技術である。
※デモグラフィックデータ:年齢、性別、居住地、家族構成、職業など、人口統計学的なデータのこと。
西内 GISがそこまで進んでいるのであれば、おすすめなのはより細かい情報の入った地図データとの紐づけですね。商業施設や公共の施設がどこにあるかなど、人口だけではわからない情報もありますから。そのようなデータと関連付けることで、〇〇のそばにある店舗が異常にパフォーマンスがいい、なんてことがわかったりします。出店した時の坪当たり売上高の予測の精度も上がるはずです。
西川 最近は、「誰がどこに住んでいるか」という人口ベースの話だけでは物足りなくて、「誰がいつどこに移動しているか」というところまで配慮して分析を行う必要が出てきたと感じています。
西内 それでいうと面白い話がありますよ。私もサポートさせていただいているのですが、地方創生のために内閣府がつくった地域経済分析システム(RESAS)というものがありまして、国勢調査のデータや流動人口データ、電話帳データなどをもとに地方創生に関わるデータを見やすく可視化しているんです。
自分たちがRESASのプロトタイピングをした際に、「このぐらいの人口であればこのあたりにお店があってもいいのに手薄だ」とか、「この地域にこの業種のお店を出すのはレッドオーシャンだからやめておいた方がいい」という分析をする画面を作ってみました。
それで面白いのが「床屋さん」と「美容院」の違いです。床屋さんは国勢調査のエリア別男性人口によって需要が読めるんですが、美容室のニーズは国勢調査の結果よりも、携帯電話会社などが集めている女性の流動人口データで見た方がよく当てられるんですね。言われてみればそのとおりで、美容室の場合、休日のお出かけとセットで行かれる方も多いので、家の近所にある必要はないわけです。
西川 面白いですね。弊社はどの企業がどこにお店を出したかは、ウェブサイトや公開情報から地道に情報を集めて月次でアップデートしているんですけど、競合のお店がどれくらいの規模で、どんなフォーマットで、どれぐらいの売上があるのかまで分解できたら便利だなと思います。
メーカーや卸売業も一体となったデータ活用で付加価値をあげていく
西内 データ活用について、御社の今後の展望をお聞かせください。
西川 われわれのデータ活用は、今大きな転機を迎えています。弊社では5年ほど前に 「MDリンク」というデータ公開システムをつくりまして、メーカーさんにID-POS情報を公開しています。ここではID-POSデータだけではなくて、店頭に設置したカメラから取得されたお客さまの行動データや、スマートレジカートから得られた購買情報なども参照することができます。
今後の弊社の大きな方向性としては、このMDリンクでお客さまデータ、商品の販売データをメーカーや卸売業の方たちと共有して、付加価値を上げたり、ムダ・ムラ・ムリを省くということを考えています。データ活用は小売業だけでは限界がありますから、メーカーさん、卸売業さんとコラボレーションしてやっていくということですね。
その中で、足りないデータがあったり、分析の仕方をもっと洗練させたり、新しい方法を導入するなど、課題は目白押しです。うまく優先順位をつけてやっていかなければなりません。われわれとしては今後、中国と日本でデータサイエンス力の強化をし、データの収集においては AI の力を活用してやっていこうと考えています。
西内 本日は貴重なお話をありがとうございました。
西内啓(にしうちひろむ) 株式会社データビークル 最高製品責任者
東京大学大学院医学系研究科医療コミュニケーション学分野助教、大学病院医療情報ネットワーク研究センター副センター長、ダナファーバー/ハーバードがん研究センター客員研究員を経て、2014年11月より株式会社データビークルを創業。自身のノウハウを活かした拡張アナリティクスツール「dataDiver」などの開発・販売と、官民のデータ活用プロジェクト支援に従事。著書に『統計学が最強の学問である』、『統計学が日本を救う』(中央公論新社)などがある。日本プロサッカーリーグ(Jリーグ)アドバイザー。
西川 晋二(にしかわ しんじ)トライアルホールディングス 取締役副会長 グループCIO/ティー・アール・イー 代表取締役社長
1982年、松下電器貿易(現Panasonic)入社。1987年、米Panasonic出向を経て、1993年にPanasonicディスクシステム事業部、帰任。1996年、トレーサーテクノロジージャパン設立、代表取締役就任。2002年にトライアルカンパニー入社。ティー・アール・イー代表取締役、トライアルカンパニーグループCIOなどを歴任。2016年7月より現職