Mẫu ngẫu nhiên và tập tổng thể
Bài toán. Một nhà sản xuất dưa chuột muối đóng hộp muốn biết phân phối chiều dài các quả dưa chuột, để làm vỏ hộp với kích thước thích hợp. Nhà sản xuất này không thể đo hết chiều dài của hàng triệu quả dưa chuột sẽ được đóng hộp. Họ chỉ đo chiều dài của $n$ quả dưa chuột được chọn một cách ngẫu nhiên, rồi từ đó ước lượng ra phân phối chiều dài. Số $n$ ở đây có thể là một số khá lớn, ví dụ 100 quả hay 1000 quả, nhưng nó là một phần rất nhỏ của tổng số các quả dưa chuột.
Để mô hình hóa bài toán ước lượng trên, ta gọi $X$ là BNN “chiều dài của quả dưa chuột”. Chúng ta muốn ước lượng phân phối xác suất của $X$, hoặc là ước lượng những đại lượng đặc trưng của $X$, ví dụ như kì vọng và phương sai. Để ước lượng, chúng ta sẽ lấy ra $n$ giá trị của $X$ một cách ngẫu nhiên và gọi các giá trị được lấy ra là $x_1,x_2,\cdots,x_n$. Bộ $(x_1,x_2,\cdots,x_n)$ được gọi là một mẫu ngẫu nhiên cỡ $n$ của BNN $X$.
Như vậy, mẫu ngẫu nhiên có nguồn gốc từ một tập lớn hơn mà ta sẽ gọi là tập tổng thể và mang thông tin nào đó về tập tổng thể, mặc dù các thông tin đó có thể khác nhau ở những mẫu khác nhau.