Module 10: Simple Linear Regression
Nguồn: SAPP Quant 2026 pp. 396–451
Learning Outcomes
| LOS | Mô tả |
|---|---|
| 10.a | Mô hình simple linear regression, OLS, diễn giải hệ số |
| 10.b | Các giả định và phân tích phần dư |
| 10.c | Đo lường độ phù hợp (), kiểm định độ phù hợp (F-test, t-test trên hệ số) |
| 10.d | ANOVA trong regression, SEE |
| 10.e | Giá trị dự báo và prediction interval |
| 10.f | Các dạng hàm khác nhau (log-lin, lin-log, log-log) |
LOS 10.a — Mô Hình
Simple linear regression:
Đường hồi quy ước lượng:
Hệ số OLS:
Diễn giải:
- (intercept) = giá trị của khi
- (slope) = sự thay đổi trong khi thay đổi 1 đơn vị
Cross-sectional vs Time-series:
- Cross-sectional: nhiều đơn vị tại cùng một thời điểm ()
- Time-series: một đơn vị theo thời gian ()
LOS 10.b — Bốn Giả Định Cốt Lõi
| Giả định | Mô tả |
|---|---|
| Linearity | Mối quan hệ giữa X và Y là tuyến tính |
| Homoskedasticity | Phương sai của phần dư là hằng số: |
| Independence | Các quan sát không tương quan với nhau: |
| Normality | Phần dư phân phối chuẩn: |
Các vi phạm được phát hiện thông qua residual plots.
LOS 10.c — Đo Lường và Kiểm Định Độ Phù Hợp
Phân Rã Tổng Bình Phương
| Thành phần | Công thức | Đo lường |
|---|---|---|
| SST (Total) | Tổng biến động trong Y | |
| SSR (Regression) | Biến động được giải thích | |
| SSE (Error) | Biến động chưa được giải thích |
(Coefficient of Determination)
càng cao → độ phù hợp càng tốt (từ 0 đến 1)
F-Test (kiểm định ý nghĩa tổng thể của mô hình)
Với simple regression: , do đó ,
- : so với :
- Bác bỏ nếu (luôn là kiểm định một phía)
t-Test trên Slope ()
t-Test trên Correlation ()
t-Test trên Intercept ()
LOS 10.d — Bảng ANOVA
| Nguồn | df | Tổng bình phương | Bình phương trung bình | F |
|---|---|---|---|---|
| Regression | SSR | |||
| Error | SSE | |||
| Total | SST |
Standard Error of Estimate:
SEE càng nhỏ → độ phù hợp càng tốt.
LOS 10.f — Các Dạng Hàm
| Mô hình | Phương trình | Diễn giải |
|---|---|---|
| Lin-lin | X tăng 1 đơn vị → Y tăng đơn vị | |
| Log-lin | X tăng 1 đơn vị → Y tăng | |
| Lin-log | X tăng 1% → Y tăng đơn vị | |
| Log-log | X tăng 1% → Y tăng (elasticity) |
Connections
- Xây dựng trên: M08 — t-test, F-test
- Sử dụng: M03 — Correlation, Variance
- Liên quan: M09 — Testing correlation significance