[[ 計量経済学のためのR環境]]

#contents

*説明変数と撹乱項(誤差項)の相関 [#x95b9d44]

 [[多重共線性]]の項でも触れたように、係数の有意性に関する判断は、誤差項が平均ゼロの正規分布をすることに依存しています。それ以外にも、成り立たなくては困る仮定がいくつかあるのです。

&ref(http://hnami.sub.jp/p/up/idprob01.jpg);

&ref(http://hnami.sub.jp/p/up/idprob02.jpg);

 という2本の式で表される、同時方程式モデルがあったとします。x、y、zは変数、a、b、c、r、sは定数である係数、εは誤差項です。zがyに、yがzに影響しあっています。こういう関係は、経済にはよくあります。

 yがzを通じてyを(部分的に)決めているというのは、自分が自分を決めていることになって、このままでは最小二乗法の基本的な仮定に反します。それなら、せっかく2本式があるのですから、先にzを消去して、2本を1本にまとめてしまったらどうでしょう。まとめると、式はこうなります。

&ref(http://hnami.sub.jp/p/up/idprob05.jpg);

 代わりにこれを推定してやれば、今の問題は起こらないように思えます。これを推定しても元の式の係数のそれぞれを知ることはできませんが、元のモデルが正しいことを間接的に検定することはできるでしょう。
 ところが、まとめた式(誘導型といいます)の誤差項である&ref(http://hnami.sub.jp/p/up/idprob06.jpg);には&ref(http://hnami.sub.jp/p/up/idprob04.jpg);が入っていますから、&ref(http://hnami.sub.jp/p/up/idprob04.jpg);がたまたまプラスのときは、zも&ref(http://hnami.sub.jp/p/up/idprob06.jpg);も平均より大きな値が出やすいと思われます。つまり、両者には相関関係があるのです。

 誤差項と説明変数の間に相関があるとどう困るのか、簡単に説明することは困難ですが、やってみましょう。最小二乗法は集めてきたデータ(標本)から係数を推定するひとつの方法なのですが、標本の偏りによって、真の係数と推定した係数はふつう一致しません。しかし、サンプル数を無限に多くすると、真の係数と推定した係数の差はゼロに近づくことが証明されています。この性質を一致性と言って、最小二乗法は一致性を持つことが重要な良さなのです。

 ところが誤差項と説明変数の間に相関がないことが、一致性の証明に使われているので、上のようなケースでは「重回帰分析を使っても、推定された係数を信用する根拠が薄い」ことになってしまうのです。

 こうした、同じ時点で複数の式が同時に成り立つと仮定することで起きる係数の偏りや根拠の喪失を''同時方程式バイアス''といいます。

*2段階最小二乗法 [#l7464c83]

 同時方程式バイアスを避けるためによく使われるのは、2SLS(2段階最小二乗法)です。モデルの中で他の変数から決まる変数(内生変数)、ここではyとzのうちひとつは被説明変数になるわけですが、もう一方(たくさん内生変数があるなら、残り全部)を外生変数でまず推定します。外生変数は、モデルの外で決まる変数です。この場合はxを説明変数、zを被説明変数とする回帰分析を行います。この例では外生変数はひとつだけですが、どれか1本でも式に含まれる外生変数をすべて使うのが普通です。

 そしてzの観測値の代わりに、推定結果を使って

&ref(http://hnami.sub.jp/p/up/idprob01.jpg);

 を推定します。この場合、yへのxの影響がzを通した間接的なものと直接的なものに分かれることになりますね。

*識別問題 [#h660b089]

トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS