Công Thức Tứ Phân Vị Và Khoảng Tứ Phân Vị Kèm Ví Dụ

Trang chủ > Công Thức > Bài hiện tại.

I. GIỚI THIỆU VỀ TỨ PHÂN VỊ

1. Tứ phân vị là gì?

Định nghĩa: Tứ phân vị (quartiles) là các giá trị chia một bộ dữ liệu đã được sắp xếp theo thứ tự tăng dần thành 4 phần bằng nhau, mỗi phần chứa 25% số quan sát.

Ba tứ phân vị chính:

Q₁ – Tứ phân vị thứ nhất (First Quartile):

  • Giá trị tại vị trí 25% của dữ liệu
  • Chia dữ liệu thành: 25% giá trị nhỏ hơn Q₁ và 75% giá trị lớn hơn Q₁
  • Còn gọi là quartile dưới (lower quartile)

Q₂ – Tứ phân vị thứ hai (Second Quartile):

  • Giá trị tại vị trí 50% của dữ liệu
  • Chính là trung vị (median)
  • Chia dữ liệu thành hai nửa bằng nhau

Q₃ – Tứ phân vị thứ ba (Third Quartile):

  • Giá trị tại vị trí 75% của dữ liệu
  • Chia dữ liệu thành: 75% giá trị nhỏ hơn Q₃ và 25% giá trị lớn hơn Q₃
  • Còn gọi là quartile trên (upper quartile)

Minh họa trực quan:

Min ────── Q₁ ────── Q₂ (Median) ────── Q₃ ────── Max
|    25%    |    25%    |    25%    |    25%    |
└───────────┴───────────┴───────────┴───────────┘
     1/4         1/4         1/4         1/4

Giải thích:

  • 25% dữ liệu nằm giữa Min và Q₁
  • 25% dữ liệu nằm giữa Q₁ và Q₂
  • 25% dữ liệu nằm giữa Q₂ và Q₃
  • 25% dữ liệu nằm giữa Q₃ và Max

II. CÔNG THỨC TÍNH TỨ PHÂN VỊ CHO DỮ LIỆU RỜI RẠC

1. Quy trình tính tứ phân vị (5 bước)

Bước 1: Sắp xếp dữ liệu

Sắp xếp tất cả các giá trị theo thứ tự tăng dần: $$x_1 \leq x_2 \leq x_3 \leq … \leq x_n$$

Lưu ý quan trọng: Đây là bước BẮT BUỘC. Nếu không sắp xếp, kết quả sẽ sai!

Bước 2: Xác định số phần tử n

Đếm tổng số giá trị trong bộ dữ liệu: $$n = \text{số lượng quan sát}$$

Bước 3: Tính vị trí các tứ phân vị

Công thức vị trí:

$$\boxed{L_1 = \frac{n+1}{4}} \quad \text{(vị trí Q₁)}$$

$$\boxed{L_2 = \frac{n+1}{2}} \quad \text{(vị trí Q₂)}$$

$$\boxed{L_3 = \frac{3(n+1)}{4}} \quad \text{(vị trí Q₃)}$$

Lưu ý: Công thức này cho ra vị trí, không phải giá trị!

Bước 4: Xác định giá trị tứ phân vị

Trường hợp 1: Nếu $L_i$ là số nguyên

  • Tứ phân vị là giá trị tại vị trí đó
  • $Q_i = x_{L_i}$

Trường hợp 2: Nếu $L_i$ không phải số nguyên

  • Cần nội suy tuyến tính giữa hai giá trị gần nhất

Bước 5: Nội suy (nếu cần)

Công thức nội suy tổng quát:

$$\boxed{Q_i = x_k + (L_i – k)(x_{k+1} – x_k)}$$

Trong đó:

  • $k = \lfloor L_i \rfloor$ (phần nguyên của $L_i$)
  • $x_k$: Giá trị tại vị trí k
  • $x_{k+1}$: Giá trị tại vị trí k+1

Các trường hợp đặc biệt:

Nếu $L_i = k + 0.5$ (nằm giữa hai vị trí): $$Q_i = \frac{x_k + x_{k+1}}{2}$$

Nếu $L_i = k + 0.25$ (gần vị trí k hơn): $$Q_i = \frac{3x_k + x_{k+1}}{4}$$

Nếu $L_i = k + 0.75$ (gần vị trí k+1 hơn): $$Q_i = \frac{x_k + 3x_{k+1}}{4}$$

2. Công thức tính từng tứ phân vị

A. Tứ phân vị thứ nhất (Q₁):

Công thức: $$\boxed{Q_1 = \text{Giá trị tại vị trí } L_1 = \frac{n+1}{4}}$$

Ý nghĩa: Q₁ là giá trị mà:

  • 25% dữ liệu nhỏ hơn hoặc bằng Q₁
  • 75% dữ liệu lớn hơn hoặc bằng Q₁

B. Tứ phân vị thứ hai (Q₂) – Trung vị:

Công thức:

$$\boxed{Q_2 = \text{Median} = \begin{cases} x_{\frac{n+1}{2}} & \text{nếu } n \text{ lẻ} \\[0.5em] \frac{x_{\frac{n}{2}} + x_{\frac{n}{2}+1}}{2} & \text{nếu } n \text{ chẵn} \end{cases}}$$

Ý nghĩa: Q₂ là trung vị – giá trị ở giữa của dữ liệu, chia dữ liệu thành hai nửa bằng nhau.

C. Tứ phân vị thứ ba (Q₃):

Công thức: $$\boxed{Q_3 = \text{Giá trị tại vị trí } L_3 = \frac{3(n+1)}{4}}$$

Ý nghĩa: Q₃ là giá trị mà:

  • 75% dữ liệu nhỏ hơn hoặc bằng Q₃
  • 25% dữ liệu lớn hơn hoặc bằng Q₃

3. Ví dụ minh họa chi tiết

Ví dụ 1: Tính tứ phân vị của dãy số: 2, 5, 7, 9, 11, 13, 15

Lời giải:

Bước 1: Kiểm tra dữ liệu đã sắp xếp: $$2, 5, 7, 9, 11, 13, 15$$ ✓ (đã tăng dần)

Bước 2: Số phần tử: $$n = 7$$

Bước 3: Tính vị trí:

  • $L_1 = \frac{7+1}{4} = \frac{8}{4} = 2$ → vị trí thứ 2
  • $L_2 = \frac{7+1}{2} = \frac{8}{2} = 4$ → vị trí thứ 4
  • $L_3 = \frac{3(7+1)}{4} = \frac{24}{4} = 6$ → vị trí thứ 6

Bước 4: Xác định giá trị (tất cả là số nguyên):

  • $Q_1 = x_2 = 5$
  • $Q_2 = x_4 = 9$ (trung vị)
  • $Q_3 = x_6 = 13$

Kết luận:

  • Q₁ = 5 (25% dữ liệu ≤ 5)
  • Q₂ = 9 (50% dữ liệu ≤ 9)
  • Q₃ = 13 (75% dữ liệu ≤ 13)

Ví dụ 2: Tính tứ phân vị của dãy số: 3, 6, 7, 8, 10, 12, 15, 18

Lời giải:

Bước 1: Dữ liệu đã sắp xếp: $$3, 6, 7, 8, 10, 12, 15, 18$$ ✓

Bước 2: Số phần tử: $$n = 8$$

Bước 3: Tính vị trí:

  • $L_1 = \frac{8+1}{4} = 2.25$ → giữa vị trí 2 và 3
  • $L_2 = \frac{8+1}{2} = 4.5$ → giữa vị trí 4 và 5
  • $L_3 = \frac{3(8+1)}{4} = 6.75$ → giữa vị trí 6 và 7

Bước 4: Nội suy (vì các vị trí không nguyên):

Tính Q₁: ($L_1 = 2.25 = 2 + 0.25$)

  • $k = 2$, $x_2 = 6$, $x_3 = 7$
  • $Q_1 = x_2 + 0.25(x_3 – x_2) = 6 + 0.25(7 – 6) = 6 + 0.25 = 6.25$

Tính Q₂: ($L_2 = 4.5 = 4 + 0.5$)

  • $k = 4$, $x_4 = 8$, $x_5 = 10$
  • $Q_2 = \frac{x_4 + x_5}{2} = \frac{8 + 10}{2} = 9$

Tính Q₃: ($L_3 = 6.75 = 6 + 0.75$)

  • $k = 6$, $x_6 = 12$, $x_7 = 15$
  • $Q_3 = x_6 + 0.75(x_7 – x_6) = 12 + 0.75(15 – 12) = 12 + 2.25 = 14.25$

Kết luận:

  • Q₁ = 6.25
  • Q₂ = 9
  • Q₃ = 14.25

III. CÔNG THỨC TÍNH TỨ PHÂN VỊ CHO BẢNG PHÂN PHỐI TẦN SỐ

1. Công thức tổng quát

Khi dữ liệu được cho dưới dạng bảng tần số hoặc tần số ghép nhóm, ta dùng công thức nội suy:

$$\boxed{Q_i = L_i + \frac{\frac{i \cdot N}{4} – F_{i-1}}{f_i} \times h}$$

Trong đó:

  • $L_i$: Cận dưới của nhóm chứa tứ phân vị $Q_i$
  • $N$: Tổng tần số (tổng số quan sát) = $\sum f_i$
  • $i$: Thứ tự tứ phân vị (1, 2, hoặc 3)
  • $F_{i-1}$: Tần số tích lũy đến trước nhóm chứa $Q_i$
  • $f_i$: Tần số của nhóm chứa $Q_i$
  • $h$: Độ rộng nhóm (khoảng cách giữa cận trên và cận dưới)

2. Các bước tính tứ phân vị cho bảng tần số

Bước 1: Tính tần số tích lũy

Tạo cột tần số tích lũy bằng cách cộng dồn tần số từ trên xuống: $$F_i = f_1 + f_2 + … + f_i$$

Bước 2: Xác định vị trí tứ phân vị

Vị trí cần tìm:

  • Vị trí Q₁: $\frac{N}{4}$ (25% dữ liệu)
  • Vị trí Q₂: $\frac{N}{2}$ (50% dữ liệu)
  • Vị trí Q₃: $\frac{3N}{4}$ (75% dữ liệu)

Bước 3: Tìm nhóm chứa tứ phân vị

Nhóm chứa $Q_i$ là nhóm có: $$\text{Tần số tích lũy} \geq \text{Vị trí cần tìm}$$

Chọn nhóm đầu tiên thỏa mãn điều kiện này.

Bước 4: Áp dụng công thức nội suy

Sử dụng công thức tổng quát đã nêu ở trên.

3. Ví dụ với bảng tần số rời rạc

Ví dụ 3: Cho bảng phân phối tần số điểm thi của 50 học sinh:

Điểm (x) 5 6 7 8 9 10
Tần số (f) 4 8 12 15 7 4

Tính Q₁, Q₂, Q₃.

Lời giải:

Bước 1: Lập bảng tần số tích lũy:

Điểm (x) Tần số (f) Tần số tích lũy (F)
5 4 4
6 8 12
7 12 24
8 15 39
9 7 46
10 4 50

Bước 2: Tính tổng tần số: $$N = 50$$

Bước 3: Xác định vị trí:

  • Vị trí Q₁: $\frac{50}{4} = 12.5$
  • Vị trí Q₂: $\frac{50}{2} = 25$
  • Vị trí Q₃: $\frac{3 \times 50}{4} = 37.5$

Bước 4: Tìm nhóm chứa:

  • Q₁: Tích lũy ≥ 12.5 lần đầu là 24 → Điểm 7
  • Q₂: Tích lũy ≥ 25 lần đầu là 39 → Điểm 8
  • Q₃: Tích lũy ≥ 37.5 lần đầu là 39 → Điểm 8

Kết luận:

  • $Q_1 = 7$ điểm
  • $Q_2 = 8$ điểm (trung vị)
  • $Q_3 = 8$ điểm

Giải thích: Với dữ liệu rời rạc không ghép nhóm, ta lấy giá trị của nhóm chứa tứ phân vị.

4. Ví dụ với bảng tần số ghép nhóm

Ví dụ 4: Cho bảng phân phối tần số ghép nhóm về cân nặng (kg) của 60 học sinh:

Nhóm [40-45) [45-50) [50-55) [55-60) [60-65)
Tần số (f) 8 12 18 14 8

Tính Q₁, Q₂, Q₃.

Lời giải:

Bước 1: Lập bảng tần số tích lũy:

Nhóm Cận dưới (L) Tần số (f) Tần số tích lũy (F)
[40-45) 40 8 8
[45-50) 45 12 20
[50-55) 50 18 38
[55-60) 55 14 52
[60-65) 60 8 60

Bước 2: Xác định:

  • $N = 60$
  • $h = 5$ (độ rộng nhóm)

Bước 3: Tính vị trí:

  • Vị trí Q₁: $\frac{60}{4} = 15$
  • Vị trí Q₂: $\frac{60}{2} = 30$
  • Vị trí Q₃: $\frac{3 \times 60}{4} = 45$

Bước 4: Xác định nhóm chứa:

  • Q₁: 15 → nhóm [45-50) (F = 20 ≥ 15)
  • Q₂: 30 → nhóm [50-55) (F = 38 ≥ 30)
  • Q₃: 45 → nhóm [55-60) (F = 52 ≥ 45)

Bước 5: Áp dụng công thức:

Tính Q₁:

  • Nhóm chứa: [45-50)
  • $L_1 = 45$, $F_0 = 8$, $f_1 = 12$, $h = 5$ $$Q_1 = 45 + \frac{15 – 8}{12} \times 5 = 45 + \frac{7 \times 5}{12} = 45 + 2.917 \approx 47.92 \text{ kg}$$

Tính Q₂:

  • Nhóm chứa: [50-55)
  • $L_2 = 50$, $F_1 = 20$, $f_2 = 18$, $h = 5$ $$Q_2 = 50 + \frac{30 – 20}{18} \times 5 = 50 + \frac{10 \times 5}{18} = 50 + 2.778 \approx 52.78 \text{ kg}$$

Tính Q₃:

  • Nhóm chứa: [55-60)
  • $L_3 = 55$, $F_2 = 38$, $f_3 = 14$, $h = 5$ $$Q_3 = 55 + \frac{45 – 38}{14} \times 5 = 55 + \frac{7 \times 5}{14} = 55 + 2.5 = 57.5 \text{ kg}$$

Kết luận:

  • Q₁ ≈ 47.92 kg (25% học sinh có cân nặng ≤ 47.92 kg)
  • Q₂ ≈ 52.78 kg (50% học sinh có cân nặng ≤ 52.78 kg)
  • Q₃ = 57.5 kg (75% học sinh có cân nặng ≤ 57.5 kg)

IV. CÔNG THỨC KHOẢNG TỨ PHÂN VỊ (IQR)

1. Định nghĩa khoảng tứ phân vị

Khoảng tứ phân vị (Interquartile Range – IQR) là khoảng cách giữa tứ phân vị thứ ba và tứ phân vị thứ nhất.

Công thức:

$$\boxed{IQR = Q_3 – Q_1}$$

Ký hiệu khác:

  • $\Delta Q$ (delta Q)
  • Range Q₃-Q₁

2. Ý nghĩa của IQR

Đo độ phân tán của 50% dữ liệu ở giữa:

IQR cho biết độ rộng của khoảng chứa 50% dữ liệu trung tâm (từ Q₁ đến Q₃), loại bỏ 25% dữ liệu nhỏ nhất và 25% dữ liệu lớn nhất.

Ví dụ: Nếu IQR = 10 điểm

  • 50% học sinh ở giữa có điểm chênh lệch nhau tối đa 10 điểm
  • IQR càng nhỏ → dữ liệu càng tập trung
  • IQR càng lớn → dữ liệu càng phân tán

Không bị ảnh hưởng bởi giá trị ngoại lệ:

Đây là ưu điểm lớn nhất của IQR so với độ lệch chuẩn.

Ví dụ so sánh:

  • Dữ liệu A: 1, 2, 3, 4, 5, 6, 7, 8, 9, 100
  • Dữ liệu B: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10

Dù có giá trị 100 (ngoại lệ) trong dữ liệu A, IQR của A và B gần như nhau vì Q₁ và Q₃ không bị ảnh hưởng nhiều.

3. Tính chất của IQR

Không nhạy cảm với ngoại lệ:

  • IQR chỉ phụ thuộc vào 50% dữ liệu giữa
  • Giá trị cực đoan không ảnh hưởng

Dễ tính toán:

  • Chỉ cần tính Q₁ và Q₃
  • Công thức đơn giản: IQR = Q₃ – Q₁

Phù hợp với dữ liệu lệch:

  • Khi dữ liệu không phân phối chuẩn
  • Khi có nhiều giá trị ngoại lệ

Đơn vị cùng với dữ liệu gốc:

  • Nếu dữ liệu tính bằng kg, IQR cũng tính bằng kg
  • Dễ diễn giải hơn phương sai (có đơn vị²)

4. Ví dụ tính IQR

Ví dụ 5: Từ Ví dụ 1

  • Q₁ = 5
  • Q₃ = 13

$$IQR = Q_3 – Q_1 = 13 – 5 = 8$$

Giải thích: 50% dữ liệu ở giữa (từ Q₁ đến Q₃) có độ rộng 8 đơn vị.

Ví dụ 6: Từ Ví dụ 4

  • Q₁ = 47.92 kg
  • Q₃ = 57.5 kg

$$IQR = 57.5 – 47.92 = 9.58 \text{ kg}$$

Giải thích: 50% học sinh có cân nặng trong khoảng 9.58 kg (từ 47.92 kg đến 57.5 kg).

V. ỨNG DỤNG: PHÁT HIỆN NGOẠI LỆ (OUTLIERS)

1. Quy tắc phát hiện ngoại lệ

Một giá trị được coi là ngoại lệ (outlier) nếu nó nằm quá xa so với phần lớn dữ liệu.

Định nghĩa ngoại lệ dựa trên IQR:

Ngoại lệ dưới (Lower outlier): $$\boxed{x < Q_1 – 1.5 \times IQR}$$

Ngoại lệ trên (Upper outlier): $$\boxed{x > Q_3 + 1.5 \times IQR}$$

Biên giới (Fences):

Lower fence (rào dưới): $$\text{LF} = Q_1 – 1.5 \times IQR$$

Upper fence (rào trên): $$\text{UF} = Q_3 + 1.5 \times IQR$$

Giá trị bình thường: Nằm trong khoảng [LF, UF]

Giá trị ngoại lệ: Nằm ngoài khoảng [LF, UF]

2. Biểu đồ hộp (Box Plot)

Biểu đồ hộp là công cụ trực quan hóa mạnh mẽ, sử dụng tứ phân vị để hiển thị phân phối dữ liệu.

Cấu trúc Box Plot:

        Lower fence            Upper fence
             │                      │
    ─────────┼──────┬───┬───┬──────┼─────────  ●
             │      │   │   │      │          (outlier)
            Min    Q₁  Q₂  Q₃     Max
                   └───┴───┘
                    IQR (Box)
              Whisker        Whisker

Các thành phần:

  1. Hộp (Box):
    • Từ Q₁ đến Q₃
    • Chiều cao = IQR
    • Chứa 50% dữ liệu ở giữa
  2. Đường giữa hộp:
    • Vị trí Q₂ (median)
    • Chia hộp thành hai phần
  3. Râu (Whiskers):
    • Râu dưới: Từ Min (trong fences) đến Q₁
    • Râu trên: Từ Q₃ đến Max (trong fences)
    • Độ dài tối đa: 1.5 × IQR
  4. Điểm ngoại lệ:
    • Đánh dấu riêng bằng dấu ● hoặc ×
    • Nằm ngoài fences

3. Ví dụ phát hiện ngoại lệ

Ví dụ 7: Cho dữ liệu: 2, 5, 7, 9, 11, 13, 15, 50

Từ Ví dụ 1 (bỏ giá trị 50), ta có:

  • Q₁ = 5
  • Q₃ = 13
  • IQR = 8

Bước 1: Tính fences: $$\text{LF} = Q_1 – 1.5 \times IQR = 5 – 1.5 \times 8 = 5 – 12 = -7$$

$$\text{UF} = Q_3 + 1.5 \times IQR = 13 + 1.5 \times 8 = 13 + 12 = 25$$

Bước 2: Kiểm tra từng giá trị:

  • 2, 5, 7, 9, 11, 13, 15: Tất cả nằm trong [-7, 25] → Bình thường
  • 50: 50 > 25 → Ngoại lệ trên

Kết luận: Giá trị 50 là ngoại lệ, có thể là lỗi đo lường hoặc trường hợp đặc biệt cần xem xét riêng.

VI. SO SÁNH TỨ PHÂN VỊ VỚI CÁC ĐẠI LƯỢNG KHÁC

Bảng so sánh chi tiết

Đại lượng Công thức/Định nghĩa Ưu điểm Nhược điểm
Trung bình ($\bar{x}$) $\frac{\sum x_i}{n}$ Dễ tính, sử dụng tất cả dữ liệu Rất nhạy cảm với ngoại lệ
Trung vị (Q₂) Giá trị ở giữa Không bị ảnh hưởng ngoại lệ Không dùng hết dữ liệu
Tứ phân vị (Q₁, Q₂, Q₃) Chia dữ liệu thành 4 phần Cho biết phân phối chi tiết, phát hiện ngoại lệ Tính toán phức tạp hơn
Độ lệch chuẩn ($\sigma$) $\sqrt{\frac{\sum(x_i – \bar{x})^2}{n}}$ Đo độ phân tán chính xác Rất nhạy cảm với ngoại lệ
IQR $Q_3 – Q_1$ Không nhạy cảm ngoại lệ, dễ hiểu Chỉ dùng 50% dữ liệu giữa
Khoảng biến thiên Max – Min Rất đơn giản Cực kỳ nhạy cảm với ngoại lệ

Khi nào dùng tứ phân vị?

NÊN DÙNG khi:

Dữ liệu có ngoại lệ:

  • Thu nhập (có người rất giàu)
  • Giá nhà (có nhà rất đắt)
  • Thời gian (có trường hợp bất thường)

Dữ liệu phân phối lệch:

  • Không phải phân phối chuẩn (bell curve)
  • Có độ lệch (skewness) rõ rệt

Cần so sánh nhiều nhóm:

  • Box Plot cho phép so sánh trực quan
  • Dễ thấy sự khác biệt giữa các nhóm

Cần phát hiện ngoại lệ:

  • Quy tắc 1.5 × IQR rất hiệu quả
  • Trực quan trên Box Plot

KHÔNG NÊN DÙNG khi:

Cần phân tích toàn bộ dữ liệu chi tiết:

  • Tứ phân vị chỉ cho 3 điểm (Q₁, Q₂, Q₃)
  • Mất thông tin về phân phối cụ thể

Dữ liệu rất ít (n < 5):

  • Khó tính tứ phân vị chính xác
  • Kết quả không đáng tin cậy

Cần độ chính xác cao cho mô hình:

  • Phân tích hồi quy, kiểm định
  • Cần dùng trung bình và độ lệch chuẩn

VII. TÓM TẮT CÔNG THỨC VÀ QUY TRÌNH

Bảng công thức tổng hợp

Công thức Ký hiệu/Cách tính Ghi chú
Vị trí Q₁ $L_1 = \frac{n+1}{4}$ Vị trí tứ phân vị thứ nhất
Vị trí Q₂ $L_2 = \frac{n+1}{2}$ Vị trí trung vị
Vị trí Q₃ $L_3 = \frac{3(n+1)}{4}$ Vị trí tứ phân vị thứ ba
Q₂ (n lẻ) $x_{\frac{n+1}{2}}$ Giá trị ở giữa
Q₂ (n chẵn) $\frac{x_{\frac{n}{2}} + x_{\frac{n}{2}+1}}{2}$ Trung bình 2 giá trị giữa
IQR $Q_3 – Q_1$ Khoảng tứ phân vị
Lower fence $Q_1 – 1.5 \times IQR$ Rào dưới phát hiện ngoại lệ
Upper fence $Q_3 + 1.5 \times IQR$ Rào trên phát hiện ngoại lệ
Q cho bảng tần số $Q_i = L_i + \frac{\frac{iN}{4} – F_{i-1}}{f_i} \times h$ Công thức nội suy
Nội suy tổng quát $Q_i = x_k + (L_i – k)(x_{k+1} – x_k)$ k = phần nguyên của $L_i$

Quy trình 5 bước tính tứ phân vị

Bước 1: SẮP XẾP DỮ LIỆU

  • ✅ Sắp xếp tăng dần: $x_1 \leq x_2 \leq … \leq x_n$
  • ⚠️ Bước BẮT BUỘC – không được bỏ qua!

Bước 2: TÍNH VỊ TRÍ

  • $L_1 = \frac{n+1}{4}$
  • $L_2 = \frac{n+1}{2}$
  • $L_3 = \frac{3(n+1)}{4}$

Bước 3: XÁC ĐỊNH GIÁ TRỊ

  • Nếu $L_i$ nguyên → $Q_i = x_{L_i}$
  • Nếu $L_i$ không nguyên → Nội suy

Bước 4: TÍNH IQR

  • $IQR = Q_3 – Q_1$

Bước 5: PHÁT HIỆN NGOẠI LỆ (nếu cần)

  • Tính fences
  • Kiểm tra giá trị nằm ngoài fences

VIII. KẾT LUẬN

Bài viết đã trình bày đầy đủ và chi tiết về tứ phân vị và khoảng tứ phân vị:

Khái niệm tứ phân vị:

  • Q₁, Q₂, Q₃ chia dữ liệu thành 4 phần bằng nhau (mỗi phần 25%)
  • Q₂ chính là trung vị
  • Cho biết phân phối dữ liệu

Công thức tính:

  • Dữ liệu rời rạc: Vị trí $L_i = \frac{(i)(n+1)}{4}$
  • Bảng tần số: $Q_i = L_i + \frac{\frac{iN}{4} – F_{i-1}}{f_i} \times h$
  • Nội suy khi vị trí không nguyên

Khoảng tứ phân vị (IQR):

  • IQR = Q₃ – Q₁
  • Đo độ phân tán của 50% dữ liệu giữa
  • Không bị ảnh hưởng bởi ngoại lệ

Phát hiện ngoại lệ:

  • Quy tắc: Ngoại lệ nằm ngoài [Q₁ – 1.5×IQR, Q₃ + 1.5×IQR]
  • Trực quan hóa bằng Box Plot

Ví dụ thực hành:

  • 7 ví dụ chi tiết từ cơ bản đến nâng cao
  • Bao gồm cả dữ liệu rời rạc và bảng tần số
ThS. Nguyễn Văn An

ThS. Nguyễn Văn An

(Người kiểm duyệt, ra đề)

Chức vụ: Tổ trưởng chuyên môn Tổ Toán tại Edus

Trình độ: Cử nhân Sư phạm Toán học, Thạc sĩ Lý luận & Phương pháp dạy học môn Toán, Chức danh nghề nghiệp giáo viên THPT – Hạng II, Tin học ứng dụng cơ bản, Ngoại ngữ B1, Chứng chỉ bồi dưỡng năng lực tổ trưởng chuyên môn

Kinh nghiệm: 12+ năm kinh nghiệm tại Trường THPT chuyên Trần Đại Nghĩa