架空のパン屋さんを例に考えてみる
パン屋さんは様々な課題を抱えています。仕入れ価格を安くしたい。売上を上げたい。従業員を適切に配置したい。廃棄を減らしたい……。そんなたくさんの課題の中から、今回は「廃棄を減らす」ことを分析のゴールにしましょう。
作ったパンの廃棄を減らすには、どうしたらいいでしょうか。売れる量だけ材料を仕入れ、毎日売り切ればいいですね。つまり、ゴールを達成するためには「その日の販売数予測」が必要です。
ある日の販売数を予測するために、これまでの販売データを見てみることにします。この時、データをどのような切り口で分析するのか決めるのが、「仮説」です。
例えば、「曜日によって売れるパンの個数が違う」という仮説を立ててみましょう。曜日と売れた個数のデータがあれば確かめることができそうですね。
今回は、日付と売れたアイテムの詳細が入っている、KaggleのTransactions from a bakeryのデータをお借りしましょう。可視化には、Tableauを使います。
それぞれの曜日に売れた商品の個数の平均をグラフにしてみました。こうして確かめると、週末に向けてゆるやかに販売数が伸び、月曜日に落ち込んでいることが分かります。
もう少し深掘りしてみましょう。品物別ではどうでしょうか。「曜日によってよく売れる品物は違う」という仮説を立てて、販売数上位5品目の曜日別の販売数のグラフを書いてみましょう。
日曜日にはサンドイッチ、ケーキが特に良く売れるようですね。コーヒー、パンは似た動き方をしています。「一緒に買う人が多いのかもしれない」ですね。この仮説を確かめるには、バスケット分析という手法を使うことになりますが、ここでは割愛します。
他にも「雨が降っていると販売数が下がりそう」とか、「タイムセール中はたくさん売れるのでは?」とか、さまざまな仮説が立てられるかと思います。毎日の天気データや、タイムセールのスケジュールと時間ごとの売上データがあれば、確かめることができそうです。
このように、分析のゴールに到達するために、目的の数字を説明できそうなデータを洗い出していく作業を、仮説構築といいます。
仮説構築の時に一番役に立つのは、現場のベテランの感覚です。「ここは小学校の近くだから、日曜日にサンドイッチを買って子どもサッカーの試合を応援するお客さんが多いんだよ」という話が聞ければ、子どもサッカーの試合スケジュールデータが欲しくなりますね。
立てた仮説に対応するデータが社内にない場合は、どうやって取得するかを新たに設計する必要があるかもしれません。
集めたデータで予測モデルを作って、ある程度の精度が出せたら、実際に施策を回してみましょう。翌日の曜日や天気予報などから予測した数のパンを作り、廃棄が減るかどうか確かめるのです。
予測があたる場合もあるでしょうし、思いもよらない知見が得られる場合もあるでしょう。それを基に、さらに仮説を構築して予測を精緻化させ、PDCAを回していく。
これが、データ活用の一つの典型的な流れかと思います。
コニカミノルタジャパンでは、さまざまな業種の分析経験を持つアナリストが揃っています。データ分析に関してお悩みがありましたら、ぜひお気軽にお問い合わせください!
今後も、いろいろな分野の技術者がコンスタントに記事を書いていきます。どうぞ、お楽しみに。