母比率の推定

特性 \( A \) の母比率が \( p \) である母集団から抽出した標本の中で、特性 \( A \) を持っているものの割合 \( R \) が 標本比率 である。例えば、大きさ \( n \) の標本の中で、特性 \( A \) をもつものの数を \( X \) 個とすると、標本比率 \( R \) は \(\displaystyle R = \dfrac{X}{n} \) となる。
標本の大きさ \( n \) が大きいとき、標本比率 \( R \) は近似的に正規分布 \(\displaystyle N \left( p, \dfrac{p (1 – p) }{n} \right) \) に従う。
よって、\(\displaystyle Z = \dfrac{ R – p }{ \sqrt { \dfrac{ p (1 – p) }{ n } } } \) は近似的に \( N(0, 1) \) に従う。ゆえに、任意の正の数 \( c \) に対して
\(\displaystyle \qquad P \left( |R – p| \leqq c \cdot \sqrt {\dfrac{ p (p – 1) }{ n } } \right) = P ( |Z| \leqq c) = 2 p(c) \)
となる。ただし、\( p(c) = P(0 \leqq Z \leqq c ) \) である。
ゆえに、
\(\displaystyle \qquad P \left( p – c \cdot \sqrt{ \dfrac{ p(1 – p)}{n}} \leqq R \leqq p + c \cdot \sqrt{ \dfrac{ p(1 – p) }{n}} \right) = 2p(c) \)
よって、
\(\displaystyle \qquad P \left( R – c \cdot \sqrt{ \dfrac{ p(1 – p)}{n}} \leqq p \leqq R + c \cdot \sqrt{ \dfrac{ p(1 – p) }{n}} \right) = 2p(c) \)
\( n \) が十分大きいとき \( R \) は \( p \) に近いとみなすことができるので、\( p (1 – p) \) を \( R (1 – R) \) で置き換えると、
\(\displaystyle \qquad P \left( R – c \cdot \sqrt{ \dfrac{ R(1 – R)}{n}} \leqq p \leqq R + c \cdot \sqrt{ \dfrac{ R(1 – R) }{n}} \right) = 2p(c) \)
\( 2p(c) = 0.95 \) を満たす \( c \) の値は正規分布表より \( c = 1.96 \) を得る。
\(\displaystyle \qquad P \left( R – 1.96 \cdot \sqrt{ \dfrac{ R(1 – R)}{n}} \leqq p \leqq R + 1.96 \cdot \sqrt{ \dfrac{ R(1 – R) }{n}} \right) = 0.95 \)
また、\( 2p(c) = 0.99 \) を満たす \( c \) の値は正規分布表より \( c = 2.58 \) を得るので
\(\displaystyle \qquad P \left( R – 2.58 \cdot \sqrt{ \dfrac{ R(1 – R)}{n}} \leqq p \leqq R + 2.58 \cdot \sqrt{ \dfrac{ R(1 – R) }{n}} \right) = 0.99 \)