![日本統計学会公式認定 統計検定 1級 公式問題集[2012〜2013年]](https://m.media-amazon.com/images/I/61GHu8G0tgL._SY425_.jpg)
日本統計学会
過去問2012年・2013年
解説
二項分布の基本的な性質を問われる問題です.
期待値, 分散, 不偏推定量, 最尤推定量([1]~[3])は完璧に導出できるようにしたいです.
二項分布の期待値と分散
二項分布の記事をご覧ください.
が最尤推定量かつ不偏推定量であることを示す.
解答
の尤度は
対数尤度は
微分してゼロに置く:
したがって は最尤推定量である.
解答
したがって は不偏推定量である.
解答
の分散 は,
推定量 より,
推定量 が不偏推定量でないことを確認する.
ここで期待値と二次モーメントより(二項分布の性質)
より
したがって は不偏推定量ではない.
また上式から
は不偏推定量となるので
を満たす は
正規近似のWald区間で比較する.
信頼区間の大きさ は,
信頼区間の長さ は,
この二つの区間を比べると
であることが分かる.
信頼区間と被覆確率
信頼区間とは,データ から区間推定量 を構成し,同じ手順を多数回繰り返すと,真のパラメータ がその区間に含まれる割合が信頼係数 になるよう設計された区間のことを指す.
例えば, 信頼係数を95%で構成するとき, 100回実験をすれば95回は信頼区間にパラメータ が含まれているということです.
被覆確率とは,真の値 の下で区間が を含む確率
のこと. 理想的には だが,有限標本や近端領域では
となる場合があるため,実際の被覆(実被覆)をシミュレーション等で評価するのが実務的です.
シミュレーション
赤が補正前の推定量 , 青が補正後の推定量 です.
グラフから, 青の線の方が名目 (信頼係数 )に近いことが分かります.
また, 付近では被覆確率が極端に低下し, 標本数が小さいと 全域で を下回ることが確認できます.
まとめ
- 離散母数問題でのWald区間は, 被覆確率を名目値に一致させるには十分な標本数が必要となる.
- 実務では Wilson や Clopper–Pearson の正確区間などの代替や補正を検討する.
![日本統計学会公式認定 統計検定 1級 公式問題集[2012〜2013年]](https://m.media-amazon.com/images/I/61GHu8G0tgL._SY425_.jpg)
日本統計学会
過去問2012年・2013年

日本統計学会
統計検定1級公式教本 網羅的に記述してあるので辞書的に使うことをおすすめします

竹村 彰通
統計検定1級対策に定番の書籍 難易度は高めだが演習問題も豊富