10.3. Kiểm định tỉ lệ của ĐLNN có phân phối Bernoulli
Mục tiêu
Giả sử ĐLNN của tổng thể là $X\sim B(n;p)$. Nếu kích thước mẫu $n$ đủ lớn (tức là $n.p\geq 5$ và $n.(1-p)\geq 5$) thì phân phối chuẩn có thể được dùng xấp xỉ phân phối nhị thức $\mathcal B(n;p)$. Khi đó tần suất mẫu $f\sim N\left(p;\dfrac{p(1-p)}{n}\right)$ và tiêu chuẩn kiểm định $T=\dfrac{f-p}{\sqrt{p(1-p)}}\sqrt{n}\sim N(0;1)$. Bài toán đặt ra là với mức ý nghĩa $\alpha$ cho trước hãy kiểm định giả thuyết $H_0:p=p_0$ (với $p_0$ cho trước).
Các kiểm định cho tỉ lệ
a) Kiểm định hai phía: khi $H_1: p\neq p_0$ thì miền bác bỏ là $$ R_\alpha=(-\infty;-U_{\alpha/2})\cup (U_{\alpha/2};+\infty). $$
b) Kiểm định một phía:
Nếu $H_1:\mu>\mu_0$ thì miền bác bỏ là $R_\alpha=(U_{\alpha};+\infty)$;
Nếu $H_1:\mu<\mu_0$ thì miền bác bỏ là $(-\infty;-U_{\alpha})$.
Ví dụ: Một tạp chí công nghệ thông tin thông báo có 25% học sinh phổ thông trung học là độc giả thường xuyên. Một mẫu ngẫu nhiên gồm 200 học sinh được chọn cho thấy có 45 em đọc tạp chí đó thường xuyên. Kiểm định tính chính xác của thông báo trên với mức ý nghĩa 0,05.
Gọi $p$ là tỉ lệ học sinh phổ thông trung học đọc tạp chí công nghệ thông tin.
Ta kiểm định: Giả thuyết $H_0: p=0,25$, đối thuyết $H_1: p\neq 0,25$.
Tiêu chuẩn kiểm định $T=\dfrac{f-0,25}{\sqrt{0,25.(1-0,25)}}\sqrt{45}$. Với mức ý nghĩa $\alpha=0,05$ thì $U_{0,025}=1,96$.
Mẫu đã cho: $f=\dfrac{45}{200}=0,225$; $n=45$, do đó giá trị quan sát thực tế là $$ |T_0|=\left|\dfrac{0,225-0,25}{0,25.0,75}\sqrt{45}\right|=0,806<1,96=U_{0,025}$$ nên ta không có cơ sở để bác bỏ thông báo của tạp chí đó.