Hypothesis Testing
Tổng quan
Hypothesis testing là quy trình thống kê chính thức dùng dữ liệu mẫu để đánh giá một nhận định về tham số tổng thể. Đây là một trong những công cụ được sử dụng rộng rãi nhất trong tài chính thực nghiệm — được áp dụng để kiểm tra xem excess return có có ý nghĩa thống kê hay không, liệu một nhân tố có khả năng dự báo hay không, hai danh mục đầu tư có mean khác nhau không, và mô hình hồi quy có giải thích được sự biến động của return hay không. Chương trình CFA nhấn mạnh một quy trình gồm sáu bước có tính kỷ luật cao.
Quy trình Sáu Bước
Bước 1 — Phát biểu các giả thuyết. Xác định null hypothesis (hiện trạng, được giả định là đúng) và alternative hypothesis (điều ta tìm kiếm bằng chứng để chứng minh). Lựa chọn giữa two-tailed test () hoặc one-tailed test ( hoặc ) dựa trên lý luận kinh tế.
Bước 2 — Chọn mức ý nghĩa . Level of significance xác định xác suất mắc phải Type I error (false positive). Các lựa chọn phổ biến: , , . Giá trị này được chọn trước khi xem dữ liệu.
Bước 3 — Xác định test statistic và phân phối của nó. Lựa chọn giữa z-test, t-test, chi-square test, hoặc F-test dựa trên tham số đang được kiểm định, phương sai tổng thể có được biết hay không, và cỡ mẫu.
Bước 4 — Phát biểu quy tắc quyết định. Xác định critical value(s) định nghĩa rejection region. Ví dụ: bác bỏ nếu với two-tailed test tại và cỡ mẫu lớn.
Bước 5 — Tính toán test statistic.
Bước 6 — Đưa ra quyết định thống kê và kết luận kinh tế. So sánh test statistic với critical value (hoặc so sánh p-value với ). “Bác bỏ ” hoặc “không bác bỏ .” Sau đó diễn giải kết quả trong bối cảnh tài chính cụ thể.
Type I và Type II Errors
Hai loại sai lầm có thể xảy ra trong hypothesis testing có sự đánh đổi vốn có:
| Quyết định | Đúng | Sai |
|---|---|---|
| Không bác bỏ | Đúng () | Type II Error () |
| Bác bỏ | Type I Error () | Đúng (Power = ) |
- Type I Error (false positive): Bác bỏ khi đúng. Xác suất = .
- Type II Error (false negative): Không bác bỏ khi sai. Xác suất = .
- Power = . Tăng cỡ mẫu sẽ tăng power trong khi giữ nguyên .
Giảm (ví dụ từ 5% xuống 1%) làm giảm Type I error nhưng tăng (và giảm power), khiến việc phát hiện các hiệu ứng thực sự trở nên khó hơn. Sự đánh đổi phù hợp phụ thuộc vào chi phí tương đối của từng loại sai lầm.
Ý nghĩa Thống kê vs. Ý nghĩa Kinh tế
Đây là một sự phân biệt quan trọng trong tài chính: Statistical significance có nghĩa là kết quả khó có khả năng xảy ra do ngẫu nhiên (p-value ), nhưng không hàm ý rằng kết quả đủ lớn để có ý nghĩa thực tiễn. Economic significance đòi hỏi độ lớn của hiệu ứng phải đủ lớn để có lợi nhuận sau khi trừ chi phí giao dịch, thuế và điều chỉnh rủi ro.
Với các mẫu rất lớn, ngay cả những chênh lệch nhỏ không đáng kể (ví dụ: excess return 0.001%) cũng có thể có statistical significance. Ngược lại, các mẫu nhỏ có thể không phát hiện được những hiệu ứng lớn về mặt kinh tế. Luôn đánh giá cả hai chiều.
Parametric vs. Nonparametric Tests
Parametric tests — như t-test, F-test và z-test — giả định rằng dữ liệu xuất phát từ một họ phân phối đã biết (thường là phân phối chuẩn) và kiểm định giả thuyết về các tham số cụ thể. Chúng có power cao hơn nonparametric tests khi các giả định phân phối được thỏa mãn.
Nonparametric tests không đưa ra giả định về phân phối. Sử dụng khi:
- Dữ liệu được đo trên thang thứ tự (ranked scale).
- Tổng thể không có phân phối chuẩn và cỡ mẫu nhỏ.
- Giả thuyết liên quan đến tính độc lập thay vì một tham số (ví dụ: chi-square test of independence).
- Dữ liệu chứa các outliers đáng kể có thể làm méo lệch parametric tests.
Nonparametric test quan trọng cần biết: Spearman rank correlation — kiểm định xem hai biến có quan hệ đơn điệu hay không, sử dụng thứ hạng của các quan sát thay vì giá trị thực của chúng.
Các Module Nguồn
- M08 — Hypothesis Testing — nội dung chính về quy trình sáu bước, các loại sai lầm, lựa chọn kiểm định
- M09 — Parametric and Nonparametric Tests — Spearman rank correlation, chi-square test of independence
- M07 — Estimation and Inference — confidence intervals như một phương pháp thay thế cho hypothesis testing