多重共線性と相関行列
をテンプレートにして作成
[
トップ
] [
新規
|
一覧
|
単語検索
|
最終更新
|
ヘルプ
]
開始行:
[[計量経済学のためのR環境]]
*相関の話(その1) [#q46a969b]
相関係数は統計学や計量経済学で、たいてい、単回帰を習う...
相関係数は-1から1の間の数です。
ふたつの変数に正の相関があると、散布図は右上がりになり...
&ref(http://hnami.sub.jp/p/up/multico01.jpg);
下は、ふたつの変数に負の相関がある例。散布図は右下がり...
&ref(http://hnami.sub.jp/p/up/multico02.jpg);
相関係数とは、ふたつの変数を説明変数・被説明変数にして...
*多重共線性 [#t8806b40]
[[重回帰分析]]の最後で、トレンドを持つ説明変数がふたつ...
多重共線性の代表的な症状は、
--わずかなデータの変化や追加・削除で係数が大きく変わる
--説明変数を追加・削除することで、もともとあった説明変数...
--個々の変数が有意でない場合にも、決定係数は高い
といったものです。
*相関の話(その2) [#k651d958]
多重共線性の有無を直観的に見る基本的な方法は、相関行列...
それにはcorとcor.testを使うので、お料理番組のようで恐縮...
dsetにsample.csvから読み込んだもの全体を代入しています...
x1 x2 y
x1 1.0000000 0.9724986 0.9172542
x2 0.9724986 1.0000000 0.8959368
y 0.9172542 0.8959368 1.0000000
左上→右下の対角線には必ず1が並びます。自分と自分の相関...
x1 x2 y
x1 1.0000000
x2 0.9724986 1.0000000
y 0.9172542 0.8959368 1.0000000
[[重回帰分析]]の最後にあったグラフでもわかることですが...
t検定は、dset全体について一度にさせることができません。...
cor.test(x1,x2)
などと組み合わせをひとつずつ指定します。この例の場合、...
Pearson's product-moment correlation
data: x1 and x2
t = 8.3509, df = 4, p-value = 0.001124
alternative hypothesis: true correlation is not equal to...
95 percent confidence interval:
0.7636128 0.9971036
sample estimates:
cor
0.9724986
このタイプの相関係数を「ピアソンの積率相関係数」といい...
&ref(http://hnami.sub.jp/p/up/single01.jpg);で仮説「b=0」...
P値は0.0011ですから0.1%余りですね。1%有意です。相関のあ...
そのあとに続いているのは「95%信頼区間」です。こういう統...
*多重共線性への対策(変数の選択) [#b43efd02]
さて、多重共線性はこのように、
--推定結果は普通に出てくる
--式の説明力を示す決定係数は高いままなこともある
--出てくる係数の推定値は、見かけよりも不安定で、信用がお...
という厄介な状況です。
経済データを「いくつか」取ってくるとき、皆さんは「時間...
各都道府県の二酸化炭素排出量を説明するために、各都道府...
多重共線性を起こしやすい説明変数の中からは、ひとつだけ...
終了行:
[[計量経済学のためのR環境]]
*相関の話(その1) [#q46a969b]
相関係数は統計学や計量経済学で、たいてい、単回帰を習う...
相関係数は-1から1の間の数です。
ふたつの変数に正の相関があると、散布図は右上がりになり...
&ref(http://hnami.sub.jp/p/up/multico01.jpg);
下は、ふたつの変数に負の相関がある例。散布図は右下がり...
&ref(http://hnami.sub.jp/p/up/multico02.jpg);
相関係数とは、ふたつの変数を説明変数・被説明変数にして...
*多重共線性 [#t8806b40]
[[重回帰分析]]の最後で、トレンドを持つ説明変数がふたつ...
多重共線性の代表的な症状は、
--わずかなデータの変化や追加・削除で係数が大きく変わる
--説明変数を追加・削除することで、もともとあった説明変数...
--個々の変数が有意でない場合にも、決定係数は高い
といったものです。
*相関の話(その2) [#k651d958]
多重共線性の有無を直観的に見る基本的な方法は、相関行列...
それにはcorとcor.testを使うので、お料理番組のようで恐縮...
dsetにsample.csvから読み込んだもの全体を代入しています...
x1 x2 y
x1 1.0000000 0.9724986 0.9172542
x2 0.9724986 1.0000000 0.8959368
y 0.9172542 0.8959368 1.0000000
左上→右下の対角線には必ず1が並びます。自分と自分の相関...
x1 x2 y
x1 1.0000000
x2 0.9724986 1.0000000
y 0.9172542 0.8959368 1.0000000
[[重回帰分析]]の最後にあったグラフでもわかることですが...
t検定は、dset全体について一度にさせることができません。...
cor.test(x1,x2)
などと組み合わせをひとつずつ指定します。この例の場合、...
Pearson's product-moment correlation
data: x1 and x2
t = 8.3509, df = 4, p-value = 0.001124
alternative hypothesis: true correlation is not equal to...
95 percent confidence interval:
0.7636128 0.9971036
sample estimates:
cor
0.9724986
このタイプの相関係数を「ピアソンの積率相関係数」といい...
&ref(http://hnami.sub.jp/p/up/single01.jpg);で仮説「b=0」...
P値は0.0011ですから0.1%余りですね。1%有意です。相関のあ...
そのあとに続いているのは「95%信頼区間」です。こういう統...
*多重共線性への対策(変数の選択) [#b43efd02]
さて、多重共線性はこのように、
--推定結果は普通に出てくる
--式の説明力を示す決定係数は高いままなこともある
--出てくる係数の推定値は、見かけよりも不安定で、信用がお...
という厄介な状況です。
経済データを「いくつか」取ってくるとき、皆さんは「時間...
各都道府県の二酸化炭素排出量を説明するために、各都道府...
多重共線性を起こしやすい説明変数の中からは、ひとつだけ...
ページ名: