オープンデータを活用した自社データの分析
公開:2021年3月19日(金)| データ分析
こんにちは。データサイエンティストの永井です。
ようやく日差しが春めいてきましたね!今年は鉢植えの一才桜でおうち花見を楽しもうと思います。
さて、ウィズコロナ時代を見据えたDXをテーマにしたブログ連載の四回目は、「オープンデータの活用」について、お話したいと思います。
データからいろいろなことが読み解けるのは分かったけれど、自社ではあまりデータを蓄積していない。これからデータを溜めていくのでは、成果が出るまでに時間がかかりすぎる。外部からデータを購入するのも難しい。
結果として、データドリブンな経営に踏み出せない企業の担当者も、いらっしゃるかもしれません。
実は、無料で公開されているデータの中にも有用なものがあります。
例えば、総務省統計局のポータルサイトe-Statでは、商圏分析に使えそうな統計データが提供されています。
今回はこれを使って、営業拠点の周りに住んでいる人を可視化してみたいと思います!
地域メッシュとは
まずは、下の画像をご覧ください。こちらは東京都港区周辺の地図です。小さいマス目でおおわれており、マスごとに違う色が塗ってあります。
この小さなマスのことを、「地域メッシュ」といいます。マス目の大きさは、この画像ですと、250m四方、5次メッシュの粒度です。徒歩3~5分圏内といったところでしょうか。
市区町村は、形や大きさがまちまちなので、同じ条件で人口や事業所数を比べることができません。同じ市内でも、たくさん人が住んでいるところと、そうでないところがあります。
そこで、全国を同じ面積のマス目に分け、それぞれのマスの中にどれくらいの人がいるかを表すことにしたのが、地域メッシュの考え方です。
一番大きい単位が1次メッシュといって、80km四方となっています。その中身を縦横に8等分して、10km四方にしたのが2次メッシュ。さらに10等分した1km四方が3次メッシュ(基準地域メッシュ)。2等分した500m四方が4次メッシュ、そして、統計局が提供するデータの中で一番細かいものが、冒頭の5次メッシュです。
このメッシュに対して、例えば、以下のようなデータが公開されています。
- 0~14歳、15歳~64歳、65歳以上に分けた男女別の人口(調査年次2015年)
- 核家族の一般世帯数(調査年次2015年)
- 全産業/産業大分類別の事業所・従業者数(調査年次2014年)
- 農林業センサスデータ(調査年次2015年)
冒頭の地図は、1次メッシュコード5339(東京中心部)のメッシュデータに対して、同地域の人口を色で表したものです。赤いところは人が多く、青いところは人が少ない地域です。都心を囲むようにドーナツ化現象が起こっていますね。勝どきのあたりが赤いのは、ここにあるタワーマンション群のためでしょうか。
人口分布レポートを作ってみよう
このレポートは、空間ファイル(メッシュの素)と、人口データで出来ています。Tableau Desktopを使って、実際に作ってみましょう。
まず、統計局の境界データから、お好みの地域のメッシュデータをダウンロードしてください。データ形式は「世界測地系緯度経度・Shapefile」です。
たくさんのファイルが並んでいますが、右上の「1次メッシュ枠情報」で場所を探すことができます。首都圏は5238、5239、5240、5338、5339、5340、5438、5439、5440のあたりです。3000番台は島しょ部~沖縄の南部、6000番台は青森~北海道のあたりになります。
次に、統計データから見たい統計データを選びます。先ほどのメッシュと同じ番号のところをダウンロードしてください。
Tableau Desktopを起動して、空間ファイルからメッシュデータの「.shp」ファイルを、テキストファイルから統計データを読み込んで、Key Code同士でリレーションシップを作ります。
ここで注意するのが、データ型の違い。メッシュデータ側のKeyCodeは文字型ですが、統計データ側のKeyCodeは整数型になっています。統計データ側の「計算の編集…」をクリックし、str()で囲んであげると、型が揃って結合できるようになります。
うまく結合できたら、あとは簡単。空間ファイル側のジオメトリとKeyCodeを詳細にドロップし、統計データ側からお好きな項目を色にドロップするだけです。どの項目が何の数字なのかは、ダウンロードページの「定義書」に書いてあります。
自社データをメッシュ化しよう
メッシュデータは、実は緯度経度から計算することができます。
詳しい計算方法は、統計局のpdf「地域メッシュ統計の特質・沿革」P13の内容を参照ください。簡単な割り算の連続ですので、Excelでも作ることができます。
例えば、コニカミノルタの営業拠点と、お客様の住所データに対し、ジオコーディングツールを用いて緯度経度を付与し、メッシュコードを計算すると、こんなレポートを作ることができます。
営業拠点を赤い点とし、顧客数を10km四方の二次メッシュとしてプロットしています。色の濃いメッシュの箇所は、お客さまがたくさんいらっしゃるエリアということになります。
必要なデータは住所だけですが、人口分布や事業所分布と見比べながら出店計画を立てたり、効率的な営業配置を考えたりと、さまざまな使い方ができます。
コニカミノルタジャパンでは、このようなマップデータを利用した分析のご支援も可能です。
ご興味のある方は、お気軽にお問い合わせください。
関連コラム記事
関連ソリューション
著者プロフィール
コニカミノルタジャパン株式会社
マーケティングサービス事業統括部
データサイエンティスト
永井 睦美
2019年にコニカミノルタジャパンに入社し、データ分析基盤の開発に携わる。
学生時代は、オンラインコミュニティにおける協働の特性について研究。電気通信大学データアントレプレナーフェロープログラム修了。
趣味はサイエンス雑貨集めと、歴史的建造物巡りです。毎朝ストームグラスを眺めて「よくわからん」と唸っています。
Web&デジタルマーケティングの
お悩みを一緒に解決します!
今後のセミナー開催情報をメルマガにてお送りします