t検定について概要解説
t検定について概要解説
統計検定の過去問題でt検定は頻出します.t検定には複数種類がありますが本質は 母平均に関する検定 であるということです.
またt検定には仮定が存在します.
仮定
- データが 正規分布 に従っている
- データの 分散が未知 である (既知の場合はZ検定)
またt検定の種類として
t検定の種類
1標本t検定 (平均はこの値であってるのか?)
2標本(対応あり)
たとえば 「手術前後の同一患者の歩行速度に差はあるか」 のように組が作れるもの
2標本の差 をとって差の母平均を検定する1標本t検定に帰着2標本(対応ない)
たとえば 「都市部校と農村部校のテスト得点平均」 のように独立しているもの- 2標本t検定(二つの分散が等しい集団の平均に差はあるか? )
- ウェルチのt検定 (二つの分散が異なる集団の平均に差はあるか?)
などがありますが、すべて 1標本t検定の派生 と考えられるでしょう.
ではt検定の種類を具体例とともに見ていきます.
1標本のt検定
問題設定
仮説
帰無仮説
対立仮説
統計量
- 標本平均
- 不偏分散
をもちいて統計量
で表せる.
T統計量が自由度 の 分布になることの証明
公式を暗記しているとこんな疑問がでてきます.公式では
結論から言うとこの
では流れを踏まえて丁寧に証明していきましょう
方針
分布の定義の形を目指す- 標準正規分布を作成
- カイ二乗分布を作成
- 公式を作成
1. 分布の定義の形を目指す
ただし
つまり 分母のカイ二乗分布の自由度が全体のt分布の自由度と一致 します.
2. 標準正規分布の作成
したがって
これを標準化すると
3. カイ二乗分布の作成
不偏分散を
ここで両辺を
ここで,
であるから,
右辺第一項は再生性より
ヒント
コクランの定理を簡単に説明すると
分解されたカイ二乗分布は自由度を足し引きできるということです.
イメージ:
4. T統計量の公式の導出
上記の1~3から
まとめ
自由度が
また不偏分散を利用するときれいに未知分散
推定・検定できる形になります.
例題
1. 両側検定
問題設定
外来高血圧患者の平均収縮期血圧がガイドライン基準
標本サイズ
母分散は未知, 各測定は正規分布からの独立標本と仮定する.
仮説
検定統計量
自由度は
判定
自由度24の
結論
平均収縮期血圧は
2. 片側検定
問題設定
糖尿病外来の集団で平均HbA1cがガイドライン基準
標本サイズ
仮説
検定統計量
判定
臨界値
結論
平均HbA1cは
参考文献

増訂版 日本統計学会公式認定 統計検定1級対応 統計学
統計検定1級公式教本 網羅的に記述してあるので辞書的に使うことをおすすめします

新装改訂版 現代数理統計学
統計検定1級対策に定番の書籍 難易度は高めだが演習問題も豊富
