Y = b0 + b1X + b2X2 + b3Z + b4ZX + b5 ZX2 + Eただし、E は残差、という関係が真の関係だとします。b0〜b5とX、E、に適当な数値を与えて Y を計算しプロットしたのが以下の図です。
赤い点が京都で黒い点が大阪です。京都のほうが大阪よりも山が高いのがわかります。さて、このような関係を OLS で推定する場合、X と Z の交互作用だけでなく、X2 と Z の交互作用効果も当然指定すべきです。しかし、私の読んだ論文では X2 と Z の交互作用効果は指定せずに X と Z の交互作用効果だけを指定していて、ちょっと驚いたわけです。いちおう査読もされていたはずなんですが。もちろんたまたま b5 が 0 という場合もありますし、0 でなくても、X と Z の交互作用を指定するだけで有意な結果が得られる時もありますが、推定結果は誤ったものになってしまいます。ちなみに、この例に関して、主効果のみのモデル、X と Z の交互作用つきのモデル、さらに X2 と Z の交互作用も追加したモデルを OLS で推定した結果が下の表です。
=====================================================
モデル1 モデル2 モデル3
-----------------------------------------------------
(Intercept) 37.86*** 38.52*** 48.88***
(3.65) (4.17) (4.55)
X 6.44*** 6.41*** 5.22***
(0.31) (0.33) (0.41)
X二乗 -0.13*** -0.13*** -0.10***
(0.01) (0.01) (0.01)
京都ダミー Z 21.97*** 20.64*** -0.07
(2.23) (4.54) (6.44)
X x 京都ダミー Z 0.05 2.44***
(0.16) (0.58)
X二乗 x 京都ダミー Z -0.05***
(0.01)
-----------------------------------------------------
adj. R-squared 0.85 0.85 0.87
AIC 771.68 773.56 758.12
N 100 100 100
=====================================================
( )内は標準誤差, *** p < 0.001
もしもモデル2 だけを推定して、モデル3 を推定しなかったら、X と Z の関係は大阪と京都で違いはないという結論を誤って下してしまうでしょう。こういうわかりやすい事例の場合は、散布図を作れば誤りは避けられるのですが、実際のデータでは散布図や残差のプロットだけではそれを見抜くことができるとは限りません。やはりモデル3 も推定してみるのが正攻法といえましょう。というか、X2 と Z の交互作用が存在しないという強い理論的な根拠でもない限りモデル2 を推定する必要はないでしょう。あるいは経営学や経済学には私の知らない慣習や理論があって、モデル2 だけを推定すればいいってことになっているんでしょうか?






