R2が負になる件

エクセルで回帰線とともに表示されるR2は、しばしば「相関係数の2乗」と説明されるが、厳密には以下の式で計算されている。「参照:www.ab.auone-net.jp/~biology生物科学研究所井口研修室WEBページ」
エクセルグラフによるR2の計算式は以下の通り。
R2=1-SSR/TSS(式1)
ここでSSRは残差平方和(回帰線との差の平方和、すなわち回帰からのずれの度合い)、TSSは全平方和(入力変数(目的変数)の変動の大きさ)を示す。(注:目的変数=A×説明変数)
平方和を求める際、エクセルグラフではTSS=Σ(y-)^2(yの平均からのずれの度合い)を用いている。したがって、回帰線の再現性が高くない場合(回帰式と実測yの差が非常に大きい場合)には実測yの変動度より大きくなることがある。この時、(式1)右辺第2項は1より大きくなり結果としてR2が負の値となる。また、R2を回帰線の説明度合の指標として用いる場合、負の値は回帰線の一致度が低いことを示している。