Chọn đến phần học sinh cần nhanh chóng thông qua mục lục bằng cách click đến phần đó
- I. GIỚI THIỆU VỀ PHÂN PHỐI CHUẨN
- 1. Phân phối chuẩn là gì?
- 2. Đặc điểm của phân phối chuẩn
- II. CÔNG THỨC PHÂN PHỐI CHUẨN
- 1. Ký hiệu và tham số
- 2. Hàm mật độ xác suất (PDF)
- 3. Tính chất của hàm mật độ
- 4. Hàm phân phối tích lũy (CDF)
- 5. Tính xác suất trong khoảng
- III. PHÂN PHỐI CHUẨN TẮC (Standard Normal Distribution)
- 1. Định nghĩa phân phối chuẩn tắc
- 2. Công thức chuẩn hóa (Standardization)
- 3. Ví dụ chuẩn hóa
- 4. Tại sao phải chuẩn hóa?
- IV. QUY TẮC 68-95-99.7 (EMPIRICAL RULE)
- 1. Nội dung quy tắc
- 2. Chi tiết từng khoảng
- 3. Ví dụ ứng dụng
- 4. Ứng dụng trong kiểm soát chất lượng
- V. CÁCH TRA BẢNG PHÂN PHỐI CHUẨN
- 1. Bảng phân phối chuẩn tắc
- 2. Các dạng bảng phổ biến
- 3. Công thức tra bảng thường dùng
- 4. Các giá trị quan trọng cần nhớ
- 5. Sử dụng máy tính/phần mềm
- VI. BÀI TẬP MẪU VÀ HƯỚNG DẪN GIẢI
- Dạng 1: Tính xác suất P(X < a)
- Dạng 2: Tính xác suất P(a < X < b)
- Dạng 3: Tính xác suất P(X > a)
- Dạng 4: Tìm giá trị khi biết xác suất
- Dạng 5: Áp dụng quy tắc 68-95-99.7
- Dạng 6: Ứng dụng kiểm soát chất lượng
- VII. ĐỊNH LÝ GIỚI HẠN TRUNG TÂM
- 1. Nội dung định lý
- 2. Ý nghĩa của định lý
- 3. Ví dụ minh họa
- 4. Ứng dụng
- VIII. MẸO VÀ LƯU Ý QUAN TRỌNG
- 1. Nhận biết bài toán phân phối chuẩn
- 2. Các công thức quan trọng cần nhớ
- 3. Các sai lầm thường gặp
- 4. Mẹo tính nhanh
- IX. KẾT LUẬN
I. GIỚI THIỆU VỀ PHÂN PHỐI CHUẨN
1. Phân phối chuẩn là gì?
Định nghĩa: Phân phối chuẩn (Normal Distribution) là phân phối xác suất liên tục quan trọng nhất và phổ biến nhất trong thống kê và xác suất.
Tên gọi khác:
- Phân phối Gauss (Gaussian Distribution) – theo tên nhà toán học Carl Friedrich Gauss
- Đường cong hình chuông (Bell Curve) – do hình dạng đặc trưng
- Phân phối Gauss-Laplace
Lịch sử: Được phát hiện và nghiên cứu bởi Carl Friedrich Gauss (1777-1855), nhà toán học và thiên văn học người Đức, khi ông nghiên cứu sai số trong đo lường thiên văn.
2. Đặc điểm của phân phối chuẩn
Phân phối chuẩn có những đặc điểm hình học và toán học đặc trưng:
Hình dạng:
- Đồ thị có dạng đối xứng qua một trục thẳng đứng
- Hình dạng giống quả chuông (bell-shaped)
- Mịn và liên tục trên toàn bộ trục số
Vị trí đỉnh:
- Đỉnh của đường cong nằm tại giá trị trung bình μ (mu)
- Đây cũng là vị trí có xác suất xuất hiện cao nhất
- Giá trị trung bình, trung vị và mode trùng nhau tại μ
Đuôi phân phối:
- Hai đuôi kéo dài vô hạn về cả hai phía (từ $-\infty$ đến $+\infty$)
- Xác suất tại các đuôi rất nhỏ, tiến về 0 nhưng không bao giờ chạm trục hoành
- Đuôi phải và đuôi trái đối xứng nhau
Diện tích:
- Tổng diện tích dưới đường cong bằng 1 (hoặc 100%)
- Diện tích này biểu diễn tổng xác suất của tất cả các giá trị có thể
Biểu đồ đặc trưng:
╱‾‾‾╲
╱ ╲
╱ ╲
╱ ╲
╱___________╲___
μ-3σ μ μ+3σ
II. CÔNG THỨC PHÂN PHỐI CHUẨN
1. Ký hiệu và tham số
Ký hiệu chuẩn: $$X \sim N(\mu, \sigma^2)$$
Đọc là: “X tuân theo phân phối chuẩn với trung bình μ và phương sai σ²”
Các tham số:
Tham số μ (mu – kỳ vọng/trung bình):
- Là giá trị trung bình của phân phối
- Xác định vị trí của đường cong trên trục số
- Đỉnh của đường cong nằm tại x = μ
- Có thể là số dương, âm hoặc bằng 0
- Đơn vị: cùng đơn vị với biến X
Tham số σ (sigma – độ lệch chuẩn):
- Đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình
- Xác định độ rộng của đường cong
- σ lớn → đường cong rộng và thấp (dữ liệu phân tán)
- σ nhỏ → đường cong hẹp và cao (dữ liệu tập trung)
- Luôn có giá trị dương: σ > 0
- Đơn vị: cùng đơn vị với biến X
Tham số σ² (phương sai):
- Là bình phương của độ lệch chuẩn
- Cũng đo lường độ phân tán nhưng ít trực quan hơn
- σ² = σ × σ
Ví dụ minh họa:
Ví dụ 1: Chiều cao nam giới
- Ký hiệu: $X \sim N(170, 25)$
- Giải thích: μ = 170 cm (chiều cao trung bình), σ² = 25 → σ = 5 cm
Ví dụ 2: Điểm thi
- Ký hiệu: $X \sim N(65, 100)$
- Giải thích: μ = 65 điểm (điểm trung bình), σ² = 100 → σ = 10 điểm
2. Hàm mật độ xác suất (PDF)
Công thức phân phối chuẩn:
$$\boxed{f(x) = \frac{1}{\sigma\sqrt{2\pi}} e^{-\frac{(x-\mu)^2}{2\sigma^2}}}$$
Trong đó:
- $f(x)$: Hàm mật độ xác suất (Probability Density Function – PDF)
- $x$: Giá trị của biến ngẫu nhiên, với $-\infty < x < +\infty$
- $\mu$: Kỳ vọng (giá trị trung bình)
- $\sigma$: Độ lệch chuẩn, với $\sigma > 0$
- $\pi \approx 3.14159$: Hằng số Pi
- $e \approx 2.71828$: Số Euler (cơ số logarit tự nhiên)
Lưu ý quan trọng:
⚠️ Công thức này được dùng để:
- Vẽ đồ thị đường cong phân phối chuẩn
- Hiểu cấu trúc toán học của phân phối
- Tính toán lý thuyết trong nghiên cứu
⚠️ Công thức này KHÔNG được dùng để:
- Tính xác suất trực tiếp trong bài tập (quá phức tạp)
- Thay vào đó, ta dùng bảng phân phối chuẩn hoặc máy tính
3. Tính chất của hàm mật độ
Tính chất 1: Giá trị không âm $$f(x) > 0 \text{ với mọi } x \in \mathbb{R}$$
Hàm mật độ luôn dương tại mọi điểm, không bao giờ âm.
Tính chất 2: Tổng diện tích bằng 1 $$\int_{-\infty}^{+\infty} f(x) , dx = 1$$
Tổng diện tích dưới đường cong bằng 1, tương ứng với 100% xác suất.
Tính chất 3: Tính đối xứng $$f(\mu + a) = f(\mu – a) \text{ với mọi } a$$
Đường cong đối xứng qua đường thẳng đứng $x = \mu$.
Tính chất 4: Giá trị cực đại $$f_{max} = f(\mu) = \frac{1}{\sigma\sqrt{2\pi}}$$
Giá trị lớn nhất của hàm đạt được tại $x = \mu$ (đỉnh của đường cong).
Tính chất 5: Điểm uốn
Đường cong có hai điểm uốn tại $x = \mu \pm \sigma$.
4. Hàm phân phối tích lũy (CDF)
Định nghĩa: Hàm phân phối tích lũy cho biết xác suất biến ngẫu nhiên X nhận giá trị nhỏ hơn hoặc bằng x.
Công thức:
$$F(x) = P(X \leq x) = \int_{-\infty}^{x} f(t) , dt = \int_{-\infty}^{x} \frac{1}{\sigma\sqrt{2\pi}} e^{-\frac{(t-\mu)^2}{2\sigma^2}} , dt$$
Vấn đề thực tế:
Tích phân này không có công thức đơn giản dạng hàm sơ cấp! Không thể tính trực tiếp bằng phương pháp giải tích thông thường.
Giải pháp trong thực hành:
- Chuẩn hóa về phân phối chuẩn tắc $Z \sim N(0,1)$
- Tra bảng phân phối chuẩn đã được tính sẵn
- Sử dụng máy tính hoặc phần mềm thống kê (Excel, Python, R)
5. Tính xác suất trong khoảng
Công thức tính xác suất P(a < X < b):
$$\boxed{P(a < X < b) = F(b) – F(a) = \int_{a}^{b} f(x) , dx}$$
Ý nghĩa hình học: Xác suất này chính là diện tích vùng nằm dưới đường cong phân phối chuẩn, giới hạn bởi $x = a$ và $x = b$.
Minh họa:
╱‾‾‾╲
╱ ╲
╱ ███ ╲
╱___███___╲___
a b
Vùng tô đậm biểu diễn $P(a < X < b)$.
Các trường hợp đặc biệt:
Xác suất lớn hơn a: $$P(X > a) = 1 – F(a) = 1 – P(X \leq a)$$
Xác suất nhỏ hơn b: $$P(X < b) = F(b) = P(X \leq b)$$
Lưu ý: Do X là biến liên tục nên $P(X = a) = 0$, do đó: $$P(X < a) = P(X \leq a)$$
III. PHÂN PHỐI CHUẨN TẮC (Standard Normal Distribution)
1. Định nghĩa phân phối chuẩn tắc
Phân phối chuẩn tắc là trường hợp đặc biệt của phân phối chuẩn với:
- Kỳ vọng: $\mu = 0$
- Độ lệch chuẩn: $\sigma = 1$
- Phương sai: $\sigma^2 = 1$
Ký hiệu: $$Z \sim N(0, 1)$$
Hàm mật độ xác suất chuẩn tắc:
$$\boxed{\phi(z) = \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}}}$$
Đây là dạng đơn giản hóa của công thức phân phối chuẩn tổng quát khi μ = 0 và σ = 1.
Hàm phân phối tích lũy chuẩn tắc:
$$\boxed{\Phi(z) = P(Z \leq z) = \int_{-\infty}^{z} \phi(t) , dt}$$
Ký hiệu Φ (Phi viết hoa) được dùng đặc biệt cho hàm phân phối tích lũy của phân phối chuẩn tắc.
2. Công thức chuẩn hóa (Standardization)
Vấn đề: Với mỗi cặp (μ, σ) khác nhau, ta có một bảng tra cứu khác nhau → Không thực tế!
Giải pháp: Chuyển đổi mọi phân phối chuẩn về dạng chuẩn tắc bằng công thức chuẩn hóa.
Công thức chuyển đổi từ X sang Z:
$$\boxed{Z = \frac{X – \mu}{\sigma}}$$
Khi đó: $Z \sim N(0, 1)$
Công thức ngược (từ Z sang X):
$$\boxed{X = \mu + Z\sigma}$$
Ý nghĩa của giá trị Z:
Z cho biết X cách xa μ bao nhiêu độ lệch chuẩn:
- $Z = 0$: X đúng bằng giá trị trung bình μ
- $Z = 1$: X lớn hơn μ đúng 1 độ lệch chuẩn (X = μ + σ)
- $Z = -1$: X nhỏ hơn μ đúng 1 độ lệch chuẩn (X = μ – σ)
- $Z = 2$: X lớn hơn μ đúng 2 độ lệch chuẩn (X = μ + 2σ)
- $Z = -2$: X nhỏ hơn μ đúng 2 độ lệch chuẩn (X = μ – 2σ)
3. Ví dụ chuẩn hóa
Ví dụ 1: Cho chiều cao nam giới $X \sim N(170, 25)$, với σ = 5 cm.
Câu hỏi: Một người cao 180 cm có giá trị Z bao nhiêu?
Lời giải:
Áp dụng công thức chuẩn hóa: $$Z = \frac{X – \mu}{\sigma} = \frac{180 – 170}{5} = \frac{10}{5} = 2$$
Giải thích: Người này cao hơn chiều cao trung bình 2 độ lệch chuẩn.
Ví dụ 2: Một người cao 162.5 cm có giá trị Z bao nhiêu?
Lời giải: $$Z = \frac{162.5 – 170}{5} = \frac{-7.5}{5} = -1.5$$
Giải thích: Người này thấp hơn chiều cao trung bình 1.5 độ lệch chuẩn.
4. Tại sao phải chuẩn hóa?
Lý do 1: Bảng tra cứu thống nhất
- Chỉ cần một bảng duy nhất cho phân phối chuẩn tắc $Z \sim N(0,1)$
- Không cần in hàng trăm bảng cho các cặp (μ, σ) khác nhau
Lý do 2: So sánh các phân phối khác nhau
- Có thể so sánh các biến có đơn vị khác nhau
- Ví dụ: So sánh điểm toán (thang điểm 100) với điểm văn (thang điểm 10)
Lý do 3: Đơn giản hóa tính toán
- Một công thức áp dụng cho mọi trường hợp
- Dễ dàng sử dụng máy tính và phần mềm
Quy trình tính xác suất chuẩn:
Bước 1: Chuẩn hóa – Chuyển X về Z bằng công thức $Z = \frac{X – \mu}{\sigma}$
Bước 2: Tra bảng hoặc dùng máy tính để tìm $\Phi(z)$
Bước 3: Tính xác suất cần tìm, ví dụ: $$P(a < X < b) = \Phi(z_2) – \Phi(z_1)$$
IV. QUY TẮC 68-95-99.7 (EMPIRICAL RULE)
1. Nội dung quy tắc
Quy tắc 68-95-99.7 (còn gọi là Quy tắc kinh nghiệm hoặc Quy tắc 3-sigma) cho biết tỷ lệ phần trăm dữ liệu nằm trong các khoảng xung quanh giá trị trung bình:
| Khoảng | Công thức | Xác suất |
|---|---|---|
| ±1σ | $P(\mu – \sigma < X < \mu + \sigma)$ | ≈ 68.27% |
| ±2σ | $P(\mu – 2\sigma < X < \mu + 2\sigma)$ | ≈ 95.45% |
| ±3σ | $P(\mu – 3\sigma < X < \mu + 3\sigma)$ | ≈ 99.73% |
Biểu đồ trực quan:
╱‾‾‾╲
╱█████╲ ← 68% nằm trong ±1σ
╱███████╲
╱█████████╲ ← 95% nằm trong ±2σ
╱███████████╲
╱_____________╲___ ← 99.7% nằm trong ±3σ
μ-3σ μ-2σ μ μ+2σ μ+3σ
2. Chi tiết từng khoảng
Khoảng 1 độ lệch chuẩn (±1σ): 68.27%
$$P(\mu – \sigma < X < \mu + \sigma) = 0.6827$$
Ý nghĩa:
- Khoảng 2/3 (gần 68%) dữ liệu nằm trong khoảng từ μ – σ đến μ + σ
- Khoảng 32% còn lại nằm ngoài khoảng này (16% mỗi phía)
Ví dụ: Nếu μ = 170cm, σ = 5cm thì:
- 68% người có chiều cao từ 165cm đến 175cm
Khoảng 2 độ lệch chuẩn (±2σ): 95.45%
$$P(\mu – 2\sigma < X < \mu + 2\sigma) = 0.9545$$
Ý nghĩa:
- Hầu hết (95%) dữ liệu nằm trong khoảng từ μ – 2σ đến μ + 2σ
- Chỉ khoảng 5% nằm ngoài khoảng này (2.5% mỗi phía)
Ví dụ: Với μ = 170cm, σ = 5cm thì:
- 95% người có chiều cao từ 160cm đến 180cm
Khoảng 3 độ lệch chuẩn (±3σ): 99.73%
$$P(\mu – 3\sigma < X < \mu + 3\sigma) = 0.9973$$
Ý nghĩa:
- Gần như tất cả (99.7%) dữ liệu nằm trong khoảng từ μ – 3σ đến μ + 3σ
- Chỉ 0.3% nằm ngoài khoảng này (rất hiếm)
Ví dụ: Với μ = 170cm, σ = 5cm thì:
- 99.7% người có chiều cao từ 155cm đến 185cm
3. Ví dụ ứng dụng
Ví dụ: Chỉ số IQ tuân theo phân phối $IQ \sim N(100, 225)$, với σ = 15.
Tính xác suất:
a) P(85 < IQ < 115)
Nhận xét: 85 = 100 – 15 = μ – σ và 115 = 100 + 15 = μ + σ
Áp dụng quy tắc: $$P(\mu – \sigma < X < \mu + \sigma) \approx 68\%$$
Đáp án: Khoảng 68% dân số có IQ từ 85 đến 115.
b) P(70 < IQ < 130)
Nhận xét: 70 = 100 – 30 = μ – 2σ và 130 = 100 + 30 = μ + 2σ
Áp dụng quy tắc: $$P(\mu – 2\sigma < X < \mu + 2\sigma) \approx 95\%$$
Đáp án: Khoảng 95% dân số có IQ từ 70 đến 130.
c) P(55 < IQ < 145)
Nhận xét: 55 = 100 – 45 = μ – 3σ và 145 = 100 + 45 = μ + 3σ
Áp dụng quy tắc: $$P(\mu – 3\sigma < X < \mu + 3\sigma) \approx 99.7%$$
Đáp án: Khoảng 99.7% dân số có IQ từ 55 đến 145.
4. Ứng dụng trong kiểm soát chất lượng
Six Sigma (6σ):
Six Sigma là phương pháp quản lý chất lượng nhằm giảm thiểu sai sót trong sản xuất.
Mục tiêu: Đảm bảo 99.9997% sản phẩm đạt chuẩn
- Sản phẩm nằm trong khoảng μ ± 6σ
- Tỷ lệ lỗi: chỉ 3.4 sản phẩm lỗi trên 1 triệu sản phẩm
- Chuẩn mực vàng trong sản xuất chất lượng cao (Toyota, Motorola, GE)
So sánh các mức sigma:
- 3σ: 99.73% đạt chuẩn → 2,700 lỗi/triệu sản phẩm
- 4σ: 99.994% đạt chuẩn → 63 lỗi/triệu sản phẩm
- 6σ: 99.9997% đạt chuẩn → 3.4 lỗi/triệu sản phẩm
V. CÁCH TRA BẢNG PHÂN PHỐI CHUẨN
1. Bảng phân phối chuẩn tắc
Bảng Φ(z) (bảng phân phối chuẩn tắc) cho giá trị: $$\Phi(z) = P(Z \leq z)$$
Cấu trúc bảng:
- Cột bên trái: Phần nguyên và chữ số thập phân thứ nhất của z (ví dụ: 0.0, 0.1, …, 1.9, 2.0,…)
- Hàng trên cùng: Chữ số thập phân thứ hai của z (0.00, 0.01, 0.02,…, 0.09)
- Ô giao nhau: Giá trị xác suất $\Phi(z)$
Ví dụ tra bảng:
Tìm $\Phi(1.96)$ (xác suất Z ≤ 1.96)
Bước 1: Tìm hàng tương ứng với 1.9 (phần nguyên + chữ số thập phân thứ nhất)
Bước 2: Tìm cột tương ứng với 0.06 (chữ số thập phân thứ hai)
Bước 3: Ô giao nhau cho giá trị: 0.9750
Vậy $\Phi(1.96) = 0.9750$ hay $P(Z \leq 1.96) = 97.50%$
2. Các dạng bảng phổ biến
Dạng 1: Bảng phân phối tích lũy $P(Z \leq z)$
- Cho trực tiếp giá trị $\Phi(z)$
- Đây là dạng bảng phổ biến nhất
Dạng 2: Bảng diện tích từ 0 đến z: $P(0 \leq Z \leq z)$
- Chỉ cho diện tích từ 0 đến z
- Cần tính: $P(Z \leq z) = 0.5 + P(0 \leq Z \leq z)$
- Lưu ý khi sử dụng loại bảng này
Lưu ý: Cần xác định rõ loại bảng đang sử dụng để tránh nhầm lẫn!
3. Công thức tra bảng thường dùng
Tính chất đối xứng (quan trọng nhất):
$$\boxed{\Phi(-z) = 1 – \Phi(z)}$$
Ví dụ: $$\Phi(-1.5) = 1 – \Phi(1.5) = 1 – 0.9332 = 0.0668$$
Xác suất trong khoảng:
$$\boxed{P(z_1 < Z < z_2) = \Phi(z_2) – \Phi(z_1)}$$
Xác suất lớn hơn:
$$\boxed{P(Z > z) = 1 – \Phi(z)}$$
Xác suất nhỏ hơn:
$$\boxed{P(Z < z) = \Phi(z)}$$
Lưu ý: Do Z liên tục nên $P(Z = z) = 0$, vì vậy: $$P(Z < z) = P(Z \leq z) = \Phi(z)$$
4. Các giá trị quan trọng cần nhớ
| z | Φ(z) | Ý nghĩa | Ghi nhớ |
|---|---|---|---|
| 0 | 0.5000 | Giá trị trung bình | 50% dữ liệu mỗi phía |
| 1 | 0.8413 | μ + 1σ | 84.13% ≤ μ+σ |
| 1.645 | 0.9500 | Phân vị 95% | Quan trọng trong ước lượng |
| 1.96 | 0.9750 | Khoảng tin cậy 95% | Cực kỳ quan trọng |
| 2 | 0.9772 | μ + 2σ | 97.72% ≤ μ+2σ |
| 2.576 | 0.9950 | Khoảng tin cậy 99% | Độ tin cậy cao |
| 3 | 0.9987 | μ + 3σ | 99.87% ≤ μ+3σ |
Mẹo nhớ giá trị z = 1.96:
- “1 chín 6” → 1.96
- Khoảng tin cậy 95% thường dùng nhất trong thống kê
5. Sử dụng máy tính/phần mềm
Máy tính Casio fx-580VN X (và các dòng tương tự):
Bước 1: Nhấn MODE → Chọn STAT
Bước 2: Chọn DIST → NORM → NormCD
Bước 3: Nhập:
- Lower: giá trị a (hoặc -∞)
- Upper: giá trị b (hoặc +∞)
- σ: độ lệch chuẩn
- μ: giá trị trung bình
Kết quả: Máy tính cho $P(a < X < b)$
Microsoft Excel:
Hàm NORM.DIST:
=NORM.DIST(x, μ, σ, TRUE)
Cho kết quả: $P(X \leq x)$
Hàm NORM.INV (hàm ngược):
=NORM.INV(xác_suất, μ, σ)
Tìm giá trị x khi biết $P(X \leq x) = $ xác_suất
Python (thư viện scipy):
from scipy.stats import norm
# Tính P(X ≤ x)
norm.cdf(x, loc=μ, scale=σ)
# Tìm x khi biết P(X ≤ x) = p
norm.ppf(p, loc=μ, scale=σ)
VI. BÀI TẬP MẪU VÀ HƯỚNG DẪN GIẢI
Dạng 1: Tính xác suất P(X < a)
Bài tập 1: Chiều cao của nam giới trưởng thành tuân theo phân phối chuẩn $X \sim N(170, 25)$, với σ = 5cm. Tính xác suất chọn ngẫu nhiên một nam giới có chiều cao dưới 165cm.
Lời giải:
Bước 1: Xác định yêu cầu
- Cần tính: $P(X < 165)$
Bước 2: Chuẩn hóa $$Z = \frac{X – \mu}{\sigma} = \frac{165 – 170}{5} = \frac{-5}{5} = -1$$
Bước 3: Tra bảng
- Cần tìm: $\Phi(-1)$
- Dùng tính chất đối xứng: $\Phi(-1) = 1 – \Phi(1)$
- Tra bảng: $\Phi(1) = 0.8413$
- Vậy: $\Phi(-1) = 1 – 0.8413 = 0.1587$
Đáp án: Xác suất là 0.1587 hay 15.87%
Giải thích: Khoảng 15.87% nam giới có chiều cao dưới 165cm.
Dạng 2: Tính xác suất P(a < X < b)
Bài tập 2: Chỉ số IQ tuân theo phân phối chuẩn $IQ \sim N(100, 225)$, với σ = 15. Tính xác suất một người có IQ từ 90 đến 120.
Lời giải:
Bước 1: Xác định yêu cầu
- Cần tính: $P(90 < X < 120)$
Bước 2: Chuẩn hóa hai đầu mút $$z_1 = \frac{90 – 100}{15} = \frac{-10}{15} = -0.67$$ $$z_2 = \frac{120 – 100}{15} = \frac{20}{15} = 1.33$$
Bước 3: Tra bảng từng giá trị
- $\Phi(-0.67) = 1 – \Phi(0.67) = 1 – 0.7486 = 0.2514$
- $\Phi(1.33) = 0.9082$
Bước 4: Tính xác suất trong khoảng $$P(90 < X < 120) = \Phi(1.33) – \Phi(-0.67)$$ $$= 0.9082 – 0.2514 = 0.6568$$
Đáp án: Xác suất là 0.6568 hay 65.68%
Dạng 3: Tính xác suất P(X > a)
Bài tập 3: Điểm thi môn Toán tuân theo phân phối $X \sim N(65, 100)$, với σ = 10 điểm. Tính xác suất một học sinh đạt trên 80 điểm.
Lời giải:
Bước 1: Xác định yêu cầu
- Cần tính: $P(X > 80)$
Bước 2: Chuẩn hóa $$Z = \frac{80 – 65}{10} = \frac{15}{10} = 1.5$$
Bước 3: Tra bảng
- $\Phi(1.5) = 0.9332$
Bước 4: Tính xác suất lớn hơn $$P(X > 80) = 1 – \Phi(1.5) = 1 – 0.9332 = 0.0668$$
Đáp án: Xác suất là 0.0668 hay 6.68%
Giải thích: Chỉ khoảng 6.68% học sinh đạt trên 80 điểm.
Dạng 4: Tìm giá trị khi biết xác suất
Bài tập 4: Cân nặng của người trưởng thành tuân theo $X \sim N(60, 64)$, với σ = 8kg. Tìm cân nặng x sao cho 90% người có cân nặng dưới x.
Lời giải:
Bước 1: Xác định yêu cầu
- Tìm x sao cho: $P(X < x) = 0.9$
Bước 2: Chuyển sang bài toán với Z
- Tìm z sao cho: $\Phi(z) = 0.9$
Bước 3: Tra bảng ngược
- Tìm trong bảng giá trị gần nhất với 0.9
- $\Phi(1.28) = 0.8997 \approx 0.9$
- Vậy $z \approx 1.28$
Bước 4: Dùng công thức ngược $$x = \mu + z\sigma = 60 + 1.28 \times 8 = 60 + 10.24 = 70.24 \text{ kg}$$
Đáp án: $x \approx 70.24$ kg
Giải thích: 90% người có cân nặng dưới 70.24kg.
Dạng 5: Áp dụng quy tắc 68-95-99.7
Bài tập 5: Thời gian hoàn thành một công việc tuân theo $X \sim N(45, 36)$, với σ = 6 phút. Tính xác suất hoàn thành công việc trong khoảng từ 33 đến 57 phút.
Lời giải:
Bước 1: Kiểm tra các đầu mút
- 33 = 45 – 12 = μ – 2σ (vì 2σ = 2 × 6 = 12)
- 57 = 45 + 12 = μ + 2σ
Bước 2: Nhận xét Khoảng từ 33 đến 57 chính là khoảng $(\mu – 2\sigma, \mu + 2\sigma)$
Bước 3: Áp dụng quy tắc 68-95-99.7 $$P(\mu – 2\sigma < X < \mu + 2\sigma) \approx 95\%$$
Đáp án: Xác suất là khoảng 95%
Ưu điểm: Không cần chuẩn hóa hay tra bảng, ước lượng nhanh!
Dạng 6: Ứng dụng kiểm soát chất lượng
Bài tập 6: Một nhà máy sản xuất linh kiện điện tử có đường kính tuân theo $X \sim N(10, 0.04)$, với σ = 0.2mm. Sản phẩm đạt chuẩn nếu đường kính nằm trong khoảng từ 9.7mm đến 10.3mm. Tính tỷ lệ phần trăm sản phẩm đạt chuẩn.
Lời giải:
Bước 1: Xác định yêu cầu
- Cần tính: $P(9.7 < X < 10.3)$
Bước 2: Chuẩn hóa $$z_1 = \frac{9.7 – 10}{0.2} = \frac{-0.3}{0.2} = -1.5$$ $$z_2 = \frac{10.3 – 10}{0.2} = \frac{0.3}{0.2} = 1.5$$
Bước 3: Tra bảng
- $\Phi(-1.5) = 1 – \Phi(1.5) = 1 – 0.9332 = 0.0668$
- $\Phi(1.5) = 0.9332$
Bước 4: Tính xác suất $$P(9.7 < X < 10.3) = 0.9332 – 0.0668 = 0.8664$$
Đáp án: Tỷ lệ sản phẩm đạt chuẩn là 86.64%
Nhận xét: Khoảng 13.36% sản phẩm không đạt chuẩn, cần cải thiện quy trình sản xuất.
VII. ĐỊNH LÝ GIỚI HẠN TRUNG TÂM
1. Nội dung định lý
Định lý giới hạn trung tâm (Central Limit Theorem – CLT) là một trong những định lý quan trọng nhất của lý thuyết xác suất.
Phát biểu:
Cho $X_1, X_2, …, X_n$ là các biến ngẫu nhiên độc lập, cùng phân phối với:
- Kỳ vọng: $E(X_i) = \mu$ (hữu hạn)
- Phương sai: $Var(X_i) = \sigma^2$ (hữu hạn)
Thì trung bình mẫu được định nghĩa là: $$\overline{X} = \frac{X_1 + X_2 + … + X_n}{n}$$
có phân phối tiến đến phân phối chuẩn khi $n \to \infty$:
$$\boxed{\overline{X} \sim N\left(\mu, \frac{\sigma^2}{n}\right)}$$
Hoặc dạng chuẩn hóa:
$$\boxed{Z = \frac{\overline{X} – \mu}{\sigma/\sqrt{n}} \sim N(0, 1)}$$
2. Ý nghĩa của định lý
Điểm quan trọng nhất:
✅ Phân phối gốc KHÔNG CẦN phải là phân phối chuẩn!
Dù các $X_i$ tuân theo phân phối nào (đều, mũ, Poisson, nhị thức,…), thì trung bình mẫu $\overline{X}$ vẫn tiến đến phân phối chuẩn khi n đủ lớn.
Quy tắc thực hành:
- Nếu $n \geq 30$: Có thể coi $\overline{X}$ gần như tuân theo phân phối chuẩn
- Nếu phân phối gốc đã gần đối xứng: n nhỏ hơn (n ≥ 15-20) cũng được
- Nếu phân phối gốc rất lệch: cần n lớn hơn (n ≥ 50-100)
Tầm quan trọng:
- Nền tảng của thống kê suy luận: ước lượng và kiểm định giả thuyết
- Giải thích tại sao phân phối chuẩn xuất hiện nhiều trong thực tế
- Cho phép sử dụng công cụ phân phối chuẩn cho nhiều bài toán khác nhau
3. Ví dụ minh họa
Ví dụ: Tung một con xúc xắc cân đối 6 mặt.
Phân phối gốc:
- Phân phối đều rời rạc (KHÔNG phải phân phối chuẩn!)
- Các giá trị: 1, 2, 3, 4, 5, 6 (mỗi giá trị có xác suất 1/6)
- Kỳ vọng: $\mu = \frac{1+2+3+4+5+6}{6} = 3.5$
- Phương sai: $\sigma^2 = \frac{35}{12} \approx 2.92$
Thí nghiệm:
- Tung xúc xắc 100 lần
- Tính trung bình 100 lần tung: $\overline{X}$
Theo CLT: $$\overline{X} \sim N\left(3.5, \frac{35/12}{100}\right) = N(3.5, 0.0292)$$
Độ lệch chuẩn của $\overline{X}$: $\sigma_{\overline{X}} = \frac{\sigma}{\sqrt{n}} = \frac{\sqrt{35/12}}{\sqrt{100}} = \frac{1.71}{10} \approx 0.17$
Kết luận: Dù phân phối gốc là đều (hình chữ nhật), phân phối của $\overline{X}$ gần như có dạng chuông (chuẩn)!
4. Ứng dụng
Ước lượng khoảng tin cậy:
- Ước lượng giá trị trung bình của tổng thể từ mẫu
- Công thức khoảng tin cậy 95%: $\overline{x} \pm 1.96 \times \frac{s}{\sqrt{n}}$
Kiểm định giả thuyết:
- Kiểm tra xem giá trị trung bình có bằng một giá trị cụ thể không
- Sử dụng thống kê z-test hoặc t-test
Kiểm soát chất lượng:
- Biểu đồ kiểm soát (Control Chart)
- Phát hiện quy trình sản xuất có vấn đề
Khảo sát dư luận:
- Ước lượng tỷ lệ ủng hộ từ mẫu khảo sát
- Tính sai số trong thăm dò dư luận
VIII. MẸO VÀ LƯU Ý QUAN TRỌNG
1. Nhận biết bài toán phân phối chuẩn
Dấu hiệu nhận biết:
Đề bài cho μ và σ (hoặc σ²)
Biến liên tục: chiều cao, cân nặng, điểm số, thời gian, nhiệt độ,…
Dữ liệu phân bố đối xứng, hình chuông
Có từ khóa: “phân phối chuẩn”, “phân phối Gauss”, “phân phối dạng chuông”
Bài toán về trung bình mẫu khi n lớn (áp dụng CLT)
Ví dụ:
- “Chiều cao nam giới có μ = 170cm, σ = 5cm” → Phân phối chuẩn
- “Điểm thi có phân bố chuẩn với trung bình 65, độ lệch chuẩn 10” → Phân phối chuẩn
2. Các công thức quan trọng cần nhớ
Công thức chuẩn hóa (QUAN TRỌNG NHẤT): $$\boxed{Z = \frac{X – \mu}{\sigma}}$$
Quy tắc 68-95-99.7:
- ±1σ: Khoảng 68% dữ liệu
- ±2σ: Khoảng 95% dữ liệu
- ±3σ: Khoảng 99.7% dữ liệu
Giá trị quan trọng cần nhớ:
- z = 1.96 → Φ(1.96) = 0.9750 (khoảng tin cậy 95%)
- z = 2.576 → Φ(2.576) = 0.9950 (khoảng tin cậy 99%)
- z = 1.645 → Φ(1.645) = 0.9500 (phân vị 95%)
Tính chất đối xứng: $$\boxed{\Phi(-z) = 1 – \Phi(z)}$$
3. Các sai lầm thường gặp
❌ SAI LẦM 1: Quên chuẩn hóa trước khi tra bảng
Sai: Tra bảng trực tiếp với giá trị X Đúng: Phải chuyển X về Z bằng công thức $Z = \frac{X – \mu}{\sigma}$ trước
❌ SAI LẦM 2: Nhầm lẫn giữa σ và σ²
Ví dụ: Đề cho $X \sim N(170, 25)$ Phải nhớ: 25 là σ² (phương sai), nên σ = 5
Mẹo: Luôn kiểm tra xem đề cho σ hay σ². Trong công thức chuẩn hóa dùng σ (không phải σ²)!
❌ SAI LẦM 3: Dùng sai dạng bảng
Có hai loại bảng:
- Bảng tích lũy: $P(Z \leq z)$
- Bảng diện tích từ 0: $P(0 \leq Z \leq z)$
Lưu ý: Phải xác định rõ loại bảng đang dùng!
❌ SAI LẦM 4: Quên tính chất đối xứng
Khi z âm, nhiều bảng không có giá trị trực tiếp. Phải dùng: $\Phi(-z) = 1 – \Phi(z)$
❌ SAI LẦM 5: Nhầm P(X > a) và P(X < a)
- $P(X < a) = \Phi\left(\frac{a-\mu}{\sigma}\right)$
- $P(X > a) = 1 – \Phi\left(\frac{a-\mu}{\sigma}\right)$
4. Mẹo tính nhanh
Mẹo 1: Xác suất bằng trung bình
Do tính đối xứng: $$P(X > \mu) = P(X < \mu) = 0.5$$
Mẹo 2: Khoảng đối xứng qua μ
Nếu tính $P(\mu – a < X < \mu + a)$ (khoảng đối xứng): $$P(\mu – a < X < \mu + a) = 2\Phi\left(\frac{a}{\sigma}\right) – 1$$
Mẹo 3: Sử dụng quy tắc 68-95-99.7
Nếu đầu mút là μ ± σ, μ ± 2σ, hoặc μ ± 3σ → Dùng ngay quy tắc, không cần tra bảng!
Mẹo 4: Kiểm tra kết quả
Xác suất phải nằm trong khoảng [0, 1]. Nếu ra ngoài khoảng này → SAI!
IX. KẾT LUẬN
Phân phối chuẩn là:
- Phân phối xác suất liên tục quan trọng nhất trong thống kê
- Có hình dạng đối xứng giống quả chuông
- Được xác định bởi hai tham số: μ (trung bình) và σ (độ lệch chuẩn)
Công thức hàm mật độ: $$f(x) = \frac{1}{\sigma\sqrt{2\pi}} e^{-\frac{(x-\mu)^2}{2\sigma^2}}$$
Ký hiệu: $$X \sim N(\mu, \sigma^2)$$
Các kiến thức trọng tâm:
Chuẩn hóa: $Z = \frac{X – \mu}{\sigma}$ (chuyển về phân phối chuẩn tắc)
Quy tắc 68-95-99.7:
- ±1σ: 68%
- ±2σ: 95%
- ±3σ: 99.7%
Tra bảng phân phối chuẩn tắc để tính xác suất
Định lý giới hạn trung tâm: Trung bình mẫu tiến đến phân phối chuẩn
ThS. Nguyễn Văn An
(Người kiểm duyệt, ra đề)
Chức vụ: Tổ trưởng chuyên môn Tổ Toán tại Edus
Trình độ: Cử nhân Sư phạm Toán học, Thạc sĩ Lý luận & Phương pháp dạy học môn Toán, Chức danh nghề nghiệp giáo viên THPT – Hạng II, Tin học ứng dụng cơ bản, Ngoại ngữ B1, Chứng chỉ bồi dưỡng năng lực tổ trưởng chuyên môn
Kinh nghiệm: 12+ năm kinh nghiệm tại Trường THPT chuyên Trần Đại Nghĩa
