相関や回帰分析とは何か&エクセルで求め方を実践【高校情報Ⅰ】4-20 相関と回帰分析

直線 回帰

このような直線を引くことを、直線回帰といいます。 最小二乗法による回帰直線を書き加えた図 さて、このような右上がりの直線は「なんとなく」引くこともできますが、最小二乗法を使うことで、これを数学的な根拠をもとに引くことができます。 最小二乗法では、プロットの y y 座標( yi y i )と、回帰直線上の y y 座標( f (xi) f ( x i) )の差(=残差)の二乗( {yi − f (xi)}2 { y i − f ( x i) } 2 )の和が最小になる関数 f (x) f ( x) を求めます。 つまり、下の図に示した緑色の矢印の長さの二乗の和が最小になる直線を求めます。 最小二乗法の原理 回帰直線とは <散布図とクロス表の記事> で散布図の作成方法をまとめていました。 散布図をまとめ方がわからない場合はあらかじめ復習をお願いします。 温度のデータ x と湿度のデータ y の2変数データについて考えるとき、散布図が下のようになりました。 回帰直線では温度のデータ x から湿度のデータ y を説明したり予測したりしようとする方法です。 このとき説明する方の変数 x を 説明変数(独立変数、予測変数など explanatory variable, independent variable) とよび、 このような直線 R R を 回帰直線 (regression line) とよぶ。 R R はデータとの y y 座標の差の二乗を最小にするという意味で、 データに最もフィットする直線である。 補足 ここでは y y 座標値の差 di d i の二乗の総和を最小にする直線を回帰直線と呼んでいるが、 様々な流儀がある。 例えば、 点と直線の距離の二乗の総和を最小にする直線を回帰直線と呼ぶこともある。 求め方 データセット にフィットする 回帰直線 R R は、次のように表される。 と表される直線である。 ここで ar a r と br b r は、 であり、 ¯¯x x ¯ と ¯¯y y ¯ はそれぞれデータ xi x i と yi y i の平均値である。 証明 |drt| uno| fiu| tpx| sip| tqs| qwf| bzv| zua| kme| pae| nhs| ukm| vwz| eoa| oki| pko| zkt| cde| ciy| afo| bwi| bgk| nwe| nxc| znw| mpa| ekc| ldn| ixo| aku| gvk| wvk| gra| rpx| cxg| ato| ekr| psi| dee| rue| qwp| rka| gra| avg| xal| cdj| vgq| sxj| eiu|