Một cách tương tự trung bình mẫu, phương sai mẫu được định nghĩa là kì vọng của độ lệch bình phương các thành phần của mẫu với trung bình mẫu và kí hiệu: $$\hat{S}^2=\dfrac{1}{n}\sum\limits_{i=1}^{n}(X_i-\overline{X})^2=\dfrac{1}{n}\sum\limits_{i=1}^{n}X_i^2-(\overline{X})^2.$$
Nếu mẫu cho dưới dạng bảng thì ta có: $$\hat{S}^2=\dfrac{1}{n}\sum_{i=1}^{n}(x_i-\overline{X})^2n_i=\dfrac{1}{n}\sum\limits_{i=1}^{n}x_i^2n_i-(\overline{X})^2.$$
Chú ý.
- Thống kê $\hat{S}$ gọi là độ lệch chuẩn mẫu chưa hiệu chỉnh và $\hat{s}$ là giá trị của $\hat{S}$với mẫu đã cho.
- Thống kê $S$ gọi là độ lệch chuẩn mẫu đã hiệu chỉnh và $s$ là giá trị của $S$ với mẫu đã cho.
Ví dụ: Tuổi thọ (đơn vị: 10 giờ) một loại linh kiện do công ty A sản xuất ra được kiểm tra ngẫu nhiên, kết quả ghi thành bảng sau:
Tuổi |
$\leq 7$ |
7-7,5 |
7,5-8 |
8-8,5 |
8,5-9 |
$\geq 9 $ |
$n_i$ |
3 |
15 |
18 |
14 |
20 |
4 |
Tính $\overline{x}, \hat{s}^2,s^2$.
Dùng giá trị chính giữa của mỗi khoảng làm đại diện cho khoảng đó, riêng với khoảng đầu và cuối ta chọn giá trị hợp lí nào đó, ví dụ 6,5 và 9,5 tương ứng, ta có bảng số liệu:
Tuổi |
$\leq 7$ |
7-7,5 |
7,5-8 |
8-8,5 |
8,5-9 |
$\geq 9 $ |
|
$x_i$ |
6,5 |
7,25 |
7,75 |
8,25 |
8,75 |
9,5 |
|
$n_i$ |
3 |
15 |
18 |
14 |
20 |
4 |
$\sum = 74$ |
$x_in_i$ |
19,5 |
108,75 |
139,5 |
111,5 |
175 |
38 |
$\sum =596,25 $ |
$x_i^2n_i$ |
126,75 |
788,4375 |
1081,125 |
952,875 |
1531,25 |
361 |
$\sum =4841,438 $ |
Từ bảng trên ta tính được: $\overline{x} \approx 8,06 , \hat{s}^2 \approx 0,503,s^2 \approx 0,51$.