Skip navigation

8.2. Phân loại và mô tả số liệu

Phân loại

Giả sử từ một tập tổng thể có $N$ phần tử, chọn ra một mẫu có kích thước $n$, các phần tử của mẫu gồm $n$ giá trị $x_1,\cdots,x_n$ tạo ra một mẫu đơn. Nếu trong mẫu có nhiều giá trị giống nhau: chẳng hạn giá trị $x_1$ xuất hiện $n_1$ lần, $x_2$ xuất hiện $n_2$ lần,..., $x_k$ xuất hiện $n_k$ lần, khi đó $n_1+n_2+\cdots+n_k=n$.

Ví dụ: Kiểm tra ngẫu nhiên 50 học viên. Ta sắp xếp điểm số môn Giải tích theo thứ tự tăng dần và số học viên có điểm tương ứng vào bảng như sau:

Điểm số  4 5 6 7 8 9 10
Số học viên 6 20 12 7 2 2 1

Tần số, bảng phân phối tần số, tần suất

Bảng tần số dạng điểm

Số lần xuất hiện $x_i$ hoặc một khoảng thứ $i$ nào đó, ký hiệu là $n_i$, được gọi là tần số. Sau khi sắp xếp số liệu theo thứ tự tăng dần của giá trị mẫu, ta có thể xây dựng bảng tần số. Bảng số liệu trong Ví dụ trên được gọi là bảng phân phối tần số dạng điểm.

Bảng tần số dạng điểm

$x_i$ $x_1$ $x_2$ $\cdots$ $x_k$
$n_i$ $n_1$ $n_2$ $\cdots$ $n_k$ $\sum\limits_i n_i=n$

Bảng tần suất dạng điểm

$x_i$ $x_1$ $x_2$ $\cdots$ $x_k$
$f_i$ $f_1$ $f_2$ $\cdots$ $f_k$ $\sum\limits_i f_i=1$

Bảng tần số dạng khoảng

b) Bảng tần số dạng khoảng

Ví dụ: Khảo sát thời gian (tuần) mang thai của thai phụ không hút thuốc. Tiến hành lấy mẫu, người ta có số liệu cho như bảng sau:

Thời gian 34-36 36-38 38-40 40-42 42-44
Số thai phụ 7 10 59 41 4

Chú ý:

  1. Quy ước: đầu mút bên phải của mỗi khoảng thuộc vào khoảng đó.
  2. Với kích thước mẫu là $n$, ta nên chọn số khoảng $k$ thỏa $2^k\geq n$.
  3. Độ rộng các khoảng không đòi hỏi bằng nhau.
  4. Khi tính toán ta đưa về bảng tần số dạng điểm bằng cách lấy giá trị chính giữa của mỗi khoảng, chẳng hạn khoảng $[a_1;a_2)$ ta sẽ lấy điểm $x_1=\dfrac{a_1+a_2}{2}$.