Mục tiêu
Giả sử ĐLNN của tổng thể là $X \sim N (\mu; \sigma^2)$ và mẫu ngẫu nhiên ($X_1,\cdots, X_n$). Bài toán đặt ra là với mức ý nghĩa $\alpha$ cho trước hãy kiểm định giả thuyết $H_0: \mu = \mu_0$ (với $µ_0$ cho trước).
Giả sử ĐLNN của tổng thể là $X \sim N (\mu; \sigma^2)$ và mẫu ngẫu nhiên ($X_1,\cdots, X_n$). Bài toán đặt ra là với mức ý nghĩa $\alpha$ cho trước hãy kiểm định giả thuyết $H_0: \mu = \mu_0$ (với $µ_0$ cho trước).
Chọn tiêu chuẩn kiểm định $T=\dfrac{\overline{X}-\mu_0}{\sigma}\sqrt{n}$. Từ giả thiết phân phối chuẩn của $X$, ta có $T\sim N(0;1)$. Ta xây dựng các miền bác bỏ dựa vào đối thuyết $H_1$ như sau:
a) Kiểm định hai phía: khi $H_1:\mu\neq\mu_0$, ta có $P(|T|>U_{\alpha/2}|H_0)=\alpha$ (xem công thức của phân phối chuẩn tắc), do đó miền bác bỏ là $$ R_\alpha=(-\infty;-U_{\alpha/2})\cup (U_{\alpha/2};+\infty).$$
b) Kiểm định một phía:
Ví dụ: Một hãng bảo hiểm thông báo “số tiền trung bình hãng chi trả cho khách hàng bị tai nạn ôtô là 170 triệu đồng”. Để kiểm tra lại, người ta kiểm tra ngẫu nhiên hồ sơ chi trả của 25 trường hợp thì thấy trung bình mẫu là 180 triệu đồng. Giả sử số tiền chi trả tuân theo luật phân phối chuẩn với $\sigma=50$ triệu đồng, hãy kiểm định lại thông báo của hãng bảo hiểm trên với $\alpha=0,05$.
Gọi $\mu$ là số tiền trung bình hãng bảo hiểm chi trả cho khách hàng bị tai nạn ôtô.
Ta kiểm định: Giả thuyết $H_0: \mu=170$, đối thuyết $H_1: \mu\neq 170$.
Tiêu chuẩn kiểm định $T=\dfrac{\overline{X}-170}{\sigma}\sqrt{n}$. Với $\alpha=0,05$ thì $U_{0,025}=1,96$.
Với mẫu đã cho: $\overline{x}=180$, $n=25$, ta có giá trị quan sát thực tế là $$ T_0=\dfrac{180-170}{50}\sqrt{25}=1<1,96=U_{0,025}$$ nên ta không có cơ sở để bác bỏ thông báo của hãng bảo hiểm.
Khi kích thước mẫu đủ lớn ($n\geq 30$) thì $\sigma\approx S$. Hơn nữa, thống kê $\dfrac{\overline{X}-\mu}{\sigma}\sqrt{n}\sim N(0;1)$. Ta xây dựng các miền bác bỏ dựa vào đối thuyết $H_1$ như sau:
a) Kiểm định hai phía: khi $H_1: \mu\neq\mu_0$ thì miền bác bỏ là $$ R_\alpha=(-\infty;-U_{\alpha/2})\cup (U_{\alpha/2};+\infty).$$
b) Kiểm định một phía:
Ví dụ: Một công ty có một hệ thống máy tính có thể xử lí 1200 hóa đơn trong một giờ. Công ty mới nhập một hệ thống máy tính mới. Hệ thống này khi chạy kiểm tra trong 40 giờ cho thấy số hóa đơn được xử lí trung bình trong 1 giờ là 1260 với độ lệch chuẩn 215. Với mức ý nghĩa 5% hãy nhận định xem hệ thống mới có tốt hơn hệ thống cũ hay không?
Gọi $\mu$ là số hóa đơn trung bình mà hệ thống máy tính mới xử lí được trong 1 giờ.
Ta kiểm định: giả thuyết $H_0: \mu=1200$, đối thuyết $H_1: \mu>1200$.
Ta có độ lệch chuẩn mẫu $\hat{S}=215$ nên $S^2=\dfrac{40}{39}215^2=217,739$; $T=1,743$; $U_{\alpha}=1,64$.
Do đó $T>U_{\alpha}$ nên bác bỏ giả thuyết. Vậy ta có thể kết luận hệ thống máy tính mới tốt hơn hệ thống cũ.
Thống kê $T=\dfrac{\overline{X}-\mu}{S}\sqrt{n}\sim T(n-1)$ (phân phối Student). Ta xây dựng các miền bác bỏ theo đối thuyết $H_1$ như sau:
a) Kiểm định hai phía: khi $H_1: \mu\neq\mu_0$, ta có $P(|T|>t_{\alpha/2}(n-1)|H_0)=\alpha$, do đó miền bác bỏ là $$ R_\alpha=\big(-\infty;-t_{\alpha/2}(n-1)\big)\cup \big(t_{\alpha/2}(n-1);+\infty\big). $$
b) Kiểm định một phía:
Ví dụ: Một công ty sản xuất hạt giống tuyên bố rằng một loại giống mới của họ có năng suất trung bình là 21,5 tạ/ha. Gieo thử và thu được kết quả
19,2 | 18,7 | 22,4 | 20,3 | 16,8 | 25,1 | 17,0 | 15,8 | 21,0 | 18,6 | 23,7 | 24,1 | 23,4 | 19,8 | 21,7 | 18,9 |
Dựa vào kết quả này hãy xác nhận xem quảng cáo của công ty có đúng không với $\alpha=0,05$. Biết rằng năng suất giống cây trồng là một biến ngẫu nhiên có phân bố chuẩn.
Ta lập bảng tần số sau:
Năng suất | 15,5-18 | 18-20,5 | 20,5-23 | 23-25,5 |
Vườn thí nghiệm | 3 | 6 | 3 | 4 |
Gọi $\mu$ là năng suất trung bình của giống mới. Ta kiểm định giả thuyết $H_0: \mu=21,5$; đối thuyết $H_1: \mu\neq 21,5$.
Ta có $\overline{X}=20,5$; $S^2=7,5$; $T=-1,46$; $t_{\alpha/2}(15)=2,131$. Do $|T|<t_{\alpha/2}(15)$ nên chưa có cơ sở bác bỏ giả thuyết. Vậy ta có thể chấp nhận lời quảng cáo của công ty.