Trong thống kê chúng ta xuất phát từ một mẫu $X_1, X_2,\cdots, X_n$ chọn từ một tổng thể chưa biết phân phối hoặc có phân phối nhưng chưa biết tham số $\theta$. Ta có thể phát biểu nhiều nhận xét khác nhau về các yếu tố chưa biết, đó là các giả thuyết thống kê. Giả thuyết được đưa ra kiểm định được gọi là giả thuyết gốc, kí hiệu là $H_0$. Các giả thuyết khác với giả thuyết gốc được gọi là giả thuyết đối hay đối thuyết, kí hiệu là $H_1$. Ta thừa nhận khi đã chọn cặp $H_0, H_1$ thì việc chấp nhận $H_0$ sẽ chính là bác bỏ $H_1$ và ngược lại. Việc kiểm định một giả thuyết là đúng hay sai dựa trên thông tin mẫu sẽ được gọi là kiểm định thống kê.
10.1. Khái niệm chung
Các nguyên tắc của kiểm định giả thuyết thống kê
Kiểm định giả thuyết thống kê dựa trên hai nguyên lí sau:
- Nguyên lí xác suất nhỏ: nếu một sự kiện có xác suất xuất hiện rất nhỏ thì có thể coi rằng nó không xảy ra khi thực hiện một phép thử có liên quan đến sự kiện đó.
- Phương pháp phản chứng: nếu từ giả thuyết $H_0$ đúng dẫn đến điều vô lí thì ta bác bỏ $H_0$ (chấp nhận đối thuyết $H_1$).
Ta thực hiện 2 nguyên lí trên bằng các bước cụ thể sau:
a) Tiêu chuẩn kiểm định giả thuyết thống kê
Từ ĐLNN gốc $X$ của tổng thể lập mẫu ngẫu nhiên $X_1,\cdots, X_n$, chọn thống kê $T = T(X_1,\cdots, X_n)$ có thể phụ thuộc vào tham số đã biết trong giả thuyết $H_0$. Nếu giả thuyết $H_0$ đúng thì luật phân phối của $T$ phải hoàn toàn xác định.
Định nghĩa: Miền bác bỏ $R_\alpha$ được xây dựng từ thống kê $T$ của mẫu gọi là tiêu chuẩn kiểm định $$ P\Big(T\in R_\alpha\big| H_0\Big)=\alpha, \quad \alpha: \text{ mức ý nghĩa của kiểm định}.$$
b) Quy tắc kiểm định
So sánh giá trị của tiêu chuẩn kiểm định $T$ với miền bác bỏ $R_\alpha$ và kết luận theo quy tắc sau:
- Nếu $T \in R_\alpha$, theo nguyên tắc kiểm định thì $H_0$ sai, do đó ta bác bỏ $H_0$, thừa nhận $H_1$.
- Nếu $T \notin R_\alpha$ thì điều này chưa khẳng định rằng $H_0$ đúng mà chỉ có nghĩa là qua mẫu cụ thể này chưa khẳng định được $H_0$ sai. Do đó ta chỉ có thể nói rằng qua mẫu cụ thể này chưa có cơ sở để bác bỏ $H_0$ (trên thực tế là thừa nhận $H_0$).
Thủ tục kiểm định giả thuyết thống kê
Thủ tục kiểm định giả thuyết thống kê bao gồm các bước sau:
- Phát biểu giả thuyết $H_0$ và đối thuyết $H_1$.
- Từ tổng thể nghiên cứu lập mẫu ngẫu nhiên kích thước $n$.
- Chọn tiêu chuẩn kiểm định $T$ và xác định quy luật phân phối xác suất của $T$ với điều kiện giả thuyết $H_0$ đúng.
- Dựa vào luật phân phối xác suất của $T$, tìm miền bác bỏ $R_\alpha$ sao cho $P(T\in R_\alpha|H_0)=\alpha$.
- Dựa vào mẫu cụ thể kích thước $n$, tính các thông số của mẫu cần thiết, thay thế vào thống kê $T$ tính được giá trị $T_0$ và gọi là giá trị quan sát thực tế hay giá trị thực nghiệm của thống kê $T$ tương ứng với mẫu.
- So sánh giá trị quan sát $T_0$ của tiêu chuẩn kiểm định $T$ với miền bác bỏ $R_\alpha$ và kết luận.