協会活動のご案内

  1. HOME
  2. ブログ
  3. 会報
  4. 連載企画第3回 統計を活用した意思決定の手法について

連載企画第3回 統計を活用した意思決定の手法について

 ビジネスにおける「統計を活用した意思決定の手法」として、前回は「重回帰分析」についてご説明しました。その際、プラスになるべき係数がマイナスになったり、マイナスになるべき係数がプラスになったりしている時は、独立変数が本当に独立なものとして機能しているかどうかを確認する必要があること、そして、もしお互いに非常に強い相関が見られる独立変数が存在する場合は、他の独立変数の説明力が正常に機能せず、不自然な解析結果になっている可能性があることについて述べました。この現象のことを多重共線性(Multi-Co-Linearity:マルチ・コ・リニアリティ 通称:マルチコ)といいますが、今回はこのマルチコのチェック方法についてご紹介します

 さて前回、住宅地の平均価格を説明するために、以下の表1を作成しました(再掲)。

 住宅の平均価格を説明するための独立変数として、10個の独立変数を用意しました。この10個の独立変数がお互いに強い相関があるかどうか調べるのに、10個の変数の中から二つ選んでそれぞれ相関係数を計算すると、かなり面倒くさい作業になりますので(10C2=45回計算しないといけません)、個別に計算するのはやめて、Excelの「データ分析」にある「相関」を使って計算してみましょう。

 前回はExcelの「データ」>「データ分析」から「回帰分析」を選択しましたが、今回は「データ>「データ分析」から「相関」を選択します。

 すると上のようなウインドウが出てきますので、「入力範囲」に「住宅(千円/㎡)」のデータ列(項目名を含む)から「外国人居住者数」までのデータ列(項目名を含む)を選択します。

 さらに「先頭行をラベルとして使用」にチェックを入れるのを忘れないようにして下さい。その上で「OK」をクリックすると、以下のような分析結果が出力されます。

 これを見ると、「幼稚園学級数」、「認定こども園学級数」、「小学校学級数」、「中学校学級数」のそれぞれの相関がほとんど0.9を超えていて、大変高くなっています。これらの学校関係の変数と「観光客数」、「外国人」も相関が高くなっているようです。

 幼稚園が多い市には、小学校や中学校も多いと思われますので、学校間での相関が高いのは直感的に納得できますが、「観光客数」や「外国人」との相関が高いのはなぜでしょうか。観光客が多いのは、観光資源が豊富にある一定規模以上の大きな都市と思われます。また外国人が多いのも、仕事が相対的に容易に見つけられるであろう、一定規模以上の大きな都市でしょう。そのような大きな都市では人口も多いので学校の数も多いということなのかもしれません。このあたりは今回の主題から外れますので、詳しく分析はしませんが、何らかの相関関係が見られることは確かです。

 それではここで相関の高い変数は外していきます。どの変数を外していくのかについて、正解は無いのですが、学校を代表する変数として、「住宅価格」との相関が一番高い(0.5877)「幼稚園学級数」を残して、「幼稚園学級数」と相関が高い「観光客数」、「認定こども園学級数」、「小学校学級数」、「中学校学級数」、「外国人」を外すことにすると、以下の表が出来ました。

 それでは残った独立変数間の相関を見てみましょう。

 独立変数間で、高い相関があるものはなさそうです。

 それではもう一度重回帰分析をしてみましょう。すると以下のような結果となりました。

 第2回目の本稿で解説しましたように、ここから分析結果のt値の絶対値を見て、低いものから外し、再度、重回帰分析を行います。まず一番t値の絶対値が低い「人口10万対医師数」を外して重回帰分析を行います。

 その結果に対し、さらにt値の絶対値が低い独立変数を外して再度重回帰分析を行う、という操作を繰り返していきますと、最終的に以下のような結果になりました。

 課税所得、幼稚園学級数のtの絶対値は2を超えています。p-値も充分に低い(5%未満)ですね。

 この式の当てはまりの良さを確認するため、Excelでは「補正R2」を確認するのでした。補正R2は0.6517ですので、観測されたデータのうち65.2%はこの回帰式で説明出来ていることになります。

 その下の分散分析表にある「有意F」は、この回帰式が、式全体として統計的に意味があるかどうかを示したものでしたね。ここでは8.441×10^(-5)という極めて小さい数値になっておりますので、統計的に無意味である確率は極めて低いということが分かります。

 さて改めてここで得られた回帰式を改めて見てみましょう。

 住宅価格(千円/㎡)をY、課税所得(千円)をX_1、幼稚園学級数をX_2とすると、Y=94.428X_1+47.33X_2-193,747.2となりました。

 回帰係数の符号を見ると、課税所得と幼稚園学級数がプラスになっています。課税所得が高いと住宅価格も高いということになりますが、課税所得が高い人が住宅価格の高い場所に住むのは直感的に理解できますね。

 幼稚園学級数についても、住宅価格のトップ3である川崎市、横浜市、藤沢市は、幼稚園学級数も多くなっています(川崎市:751(2位)、横浜市:1,890(1位)、藤沢市:234(4位))。人口が多い都市部では幼稚園学級数も多く、そのような都市部の住宅価格が高いというのも、直感的に理解できますね。

 ここまで作業をして、ようやくマルチコの影響を受けていない回帰式が導出できました。

 さてここから何が言えるでしょうか。神奈川県内の各市における住宅価格は、住民の課税所得と幼稚園学級数で、ある程度(65.7%)説明できる(予測できる)ということは分かりました。しかし、この結果だけ見ても、「だから何?」で終わってしまうかもしれませんね。これは取り上げたテーマが実務家の皆さんにとって、あまり興味の無い内容だったからかもしれません。実際の実務では、例えば、「どの広告媒体にどれだけ金を払えば、売り上げがどのくらい上がるのか調べて欲しい」というような課題が上司から与えられるといったケースが想定されます。そのような課題に対し、こうしたツールを使って説明することによって、意思決定により一層説得力が増すことになろうかと思います。

 ここまで重回帰分析の基本についてご紹介してまいりましたが、次回は実務の場面において、役に立つ統計分析に関するヒント・コツをいくつかご紹介したいと思います。

【参考文献】
はじめての統計学 鳥居泰彦(日本経済新聞社)
ビジネス統計学 上・下 アミール・D・アクゼル他(ダイヤモンド社)
文系のための理系的問題解決 多田実(オーム社)
Excelで学ぶ経営科学 多田実・大西正和他(オーム社)

【鷹野 慎太朗】

  • コメント ( 0 )

  • トラックバックは利用できません。

  1. この記事へのコメントはありません。

関連記事

活動のご報告