Practice: M08 — Hypothesis Testing
Module: M08 Glossary: M08 Terms
Topic 1: Process of Hypothesis Testing
Question 1: State the hypotheses for testing whether:
- (i) Population mean return equals 6%
- (ii) Population mean return is greater than 6%
- (iii) Population mean return is less than 6%
Answer
(i) Two-tailed: , (ii) Right-tail: , (iii) Left-tail: ,
📖 Giải thích chi tiết
Ôn lại khái niệm: Trong hypothesis testing, null hypothesis () luôn chứa dấu bằng (=, ≤, hoặc ≥). Alternative hypothesis () là điều nhà phân tích muốn chứng minh và chứa dấu ≠, >, hoặc <. Chiều của quyết định loại test: hai đuôi (two-tailed) hay một đuôi (one-tailed).
Tại sao (i) là two-tailed: “Bằng 6%” không xác định hướng lệch → → test hai đuôi. Vùng bác bỏ nằm ở cả hai phía của phân phối.
Tại sao (ii) là right-tail: Muốn chứng minh mean lớn hơn 6% → → vùng bác bỏ nằm ở đuôi phải. là (giả thuyết ngược lại — không có bằng chứng mean > 6).
Tại sao (iii) là left-tail: Muốn chứng minh mean nhỏ hơn 6% → → vùng bác bỏ nằm ở đuôi trái. là .
Nguyên tắc quan trọng: Dấu bằng luôn thuộc về . Nếu test one-tailed, dùng ≤ (right-tail test) hoặc ≥ (left-tail test), không dùng dấu = đơn thuần.
Question 2: A two-tailed test at 5% significance has z-critical value = ±1.96. The calculated test statistic is 2.15. The decision is:
A. Fail to reject B. Reject C. Accept
Answer
B. |2.15| > 1.96 → reject . Never say “accept ” — we either reject or fail to reject.
📖 Giải thích chi tiết
Ôn lại khái niệm: Quy tắc quyết định trong hypothesis testing: Bác bỏ nếu |test statistic| > critical value (two-tailed). Test statistic rơi vào rejection region (vùng bác bỏ) → đủ bằng chứng thống kê để bác bỏ .
Tại sao B đúng: → test statistic nằm trong vùng bác bỏ (bên ngoài ±1.96) → Reject . Ở mức ý nghĩa 5%, có đủ bằng chứng thống kê để bác bỏ giả thuyết null.
Tại sao A sai: “Fail to reject” xảy ra khi |test statistic| ≤ critical value. Ở đây 2.15 > 1.96 nên không phải trường hợp này.
Tại sao C sai — quy tắc ngôn ngữ CFA quan trọng: Không bao giờ nói “accept ” trong hypothesis testing. Khi không đủ bằng chứng bác bỏ, ta chỉ “fail to reject” (không bác bỏ được) — điều này không có nghĩa là đúng, chỉ là không có đủ bằng chứng để bác bỏ nó. Đây là lỗi ngôn ngữ thường gặp mà CFA exam rất hay hỏi.
Topic 2: Test of Single Mean
Question 3: ACE High Yield Total Return Index — test if mean daily returns differ between two periods:
| Period 1 | Period 2 | |
|---|---|---|
| Mean | 0.01775% | 0.01134% |
| Std Dev | 0.31580% | 0.38760% |
| Sample size | 445 days | 859 days |
Test at 5% significance whether means are different.
Answer
, df = 1302, → Do not reject . No sufficient evidence that means differ.
📖 Giải thích chi tiết
Ôn lại khái niệm: Two-sample t-test kiểm định xem hai tổng thể có trung bình bằng nhau không. Khi giả định pooled variance (phương sai bằng nhau), tính là phương sai gộp từ cả hai mẫu, rồi dùng nó để tính standard error của hiệu trung bình.
Logic tính toán:
- — phương sai gộp có trọng số theo df
- t-statistic = (hiệu trung bình quan sát) / (standard error của hiệu) =
- df = → với df lớn,
Tại sao không bác bỏ : — test statistic nằm sâu trong vùng không bác bỏ. Sự chênh lệch nhỏ về trung bình (0.00641%) không đủ lớn so với biến động trong dữ liệu. Không có bằng chứng thống kê cho thấy trung bình hai giai đoạn khác nhau.
Lưu ý thực tế: Mặc dù giai đoạn 2 có std dev lớn hơn, điều này không ảnh hưởng đến kết luận về mean — hai câu hỏi (mean có bằng nhau không? variance có bằng nhau không?) được kiểm định riêng biệt.
Topic 3: Test of Single Variance (Chi-Square)
Question 4: Sendar Equity Fund, 24 months, mean monthly return = 1.50%, std dev = 3.60%. Test whether at 5% significance.
Answer
, df = 23, one-tailed (left), Lower critical value = 13.091 (from chi-square table, 0.95 probability in right tail) → Do not reject . Insufficient evidence that .
📖 Giải thích chi tiết
Ôn lại khái niệm: Chi-square test dùng để kiểm định phương sai của một tổng thể. Test statistic: , phân phối theo chi-square với . Phân phối chi-square không đối xứng và chỉ nhận giá trị dương — cần tra bảng cẩn thận cho one-tailed test.
Logic của bài toán:
- Muốn chứng minh → → left-tail test
- (giả thuyết null: phương sai vẫn cao)
- Left-tail, , df = 23: critical value = 13.091 (tức là 5% probability nằm bên trái 13.091)
- Vùng bác bỏ: . Nhưng → không bác bỏ
Tại sao không bác bỏ: Mặc dù , sự chênh lệch này không đủ lớn về mặt thống kê với chỉ 24 quan sát. Cần bằng chứng mạnh hơn để kết luận phương sai tổng thể thực sự nhỏ hơn 4%.
Topic 4: Test of Variance Equality (F-Test)
Question 5: You investigate whether population variance of returns changed after a market disruption:
| Before | After | |
|---|---|---|
| n | 120 | 120 |
| Mean monthly return | 1.416% | 1.436% |
| Variance | 22.367 | 15.795 |
Test at 0.05 significance. F-test critical values: 0.6969 and 1.4349.
Answer
A. , B. , df₁ = df₂ = 119 C. Two-tailed F-test: reject if F > 1.4349 or F < 0.6969 is between 0.6969 and 1.4349 → Do not reject . Insufficient evidence that variance changed.
📖 Giải thích chi tiết
Ôn lại khái niệm: F-test so sánh hai phương sai từ hai tổng thể độc lập. F-statistic = , phân phối theo F-distribution với . Thông thường đặt phương sai lớn hơn ở tử số để F ≥ 1 (simplifies one-tailed lookup), nhưng ở đây bài cho sẵn critical values hai phía.
Tại sao không bác bỏ : nằm giữa hai critical values (0.6969 và 1.4349) → nằm trong vùng không bác bỏ. Dù variance trước disruption (22.367) cao hơn sau disruption (15.795) — một sự chênh lệch đáng kể về mặt kinh tế — nhưng với cho mỗi giai đoạn, sự chênh lệch này vẫn chưa đủ ý nghĩa thống kê ở mức 5%.
Tại sao A sai (nếu ai viết ): Đây là two-tailed test vì câu hỏi hỏi liệu variance có “thay đổi” không — không chỉ định hướng. Nếu biết trước disruption thường làm tăng volatility, mới dùng one-tailed.
Lưu ý: F-distribution không đối xứng; critical values hai phía không bằng nhau. Critical value phía dưới (0.6969) là nghịch đảo xấp xỉ của critical value phía trên cho các df tương đương.
Topic 5: p-Value
Question 6: If a test has a p-value of 0.03, which of the following is correct?
A. Reject at 1% significance B. Reject at 5% significance C. Fail to reject at 10% significance
Answer
B. Reject when p-value < . p = 0.03 < 0.05 → reject at 5%. But 0.03 > 0.01 → do not reject at 1%. And 0.03 < 0.10 → also reject at 10% (so C is wrong).
📖 Giải thích chi tiết
Ôn lại khái niệm: p-value là xác suất thu được kết quả cực đoan như quan sát hoặc cực đoan hơn, giả sử đúng. Quy tắc: Bác bỏ khi p-value < (mức ý nghĩa). p-value nhỏ hơn → bằng chứng mạnh hơn chống lại .
Kiểm tra từng đáp án với p = 0.03:
- Tại : → không bác bỏ → A sai
- Tại : → bác bỏ → B đúng
- Tại : → bác bỏ → C sai (C nói “fail to reject” nhưng thực ra phải bác bỏ)
Cách nhớ: p-value = 0.03 có nghĩa là nếu đúng, chỉ có 3% cơ hội thấy kết quả này hoặc cực đoan hơn. Mức ý nghĩa 5% nói rằng chúng ta chấp nhận 5% nguy cơ Type I error → 3% < 5% → đủ cơ sở bác bỏ. Nhưng ở mức 1%, 3% vẫn cao hơn ngưỡng chấp nhận.
Tổng kết: p = 0.03 có ý nghĩa ở và , nhưng không có ý nghĩa ở .