Module 10: Simple Linear Regression

Nguồn: SAPP Quant 2026 pp. 396–451

Learning Outcomes

LOSMô tả
10.aMô hình simple linear regression, OLS, diễn giải hệ số
10.bCác giả định và phân tích phần dư
10.cĐo lường độ phù hợp (), kiểm định độ phù hợp (F-test, t-test trên hệ số)
10.dANOVA trong regression, SEE
10.eGiá trị dự báo và prediction interval
10.fCác dạng hàm khác nhau (log-lin, lin-log, log-log)

LOS 10.a — Mô Hình

Simple linear regression:

Đường hồi quy ước lượng:

Hệ số OLS:

Diễn giải:

  • (intercept) = giá trị của khi
  • (slope) = sự thay đổi trong khi thay đổi 1 đơn vị

Cross-sectional vs Time-series:

  • Cross-sectional: nhiều đơn vị tại cùng một thời điểm ()
  • Time-series: một đơn vị theo thời gian ()

LOS 10.b — Bốn Giả Định Cốt Lõi

Giả địnhMô tả
LinearityMối quan hệ giữa X và Y là tuyến tính
HomoskedasticityPhương sai của phần dư là hằng số:
IndependenceCác quan sát không tương quan với nhau:
NormalityPhần dư phân phối chuẩn:

Các vi phạm được phát hiện thông qua residual plots.

LOS 10.c — Đo Lường và Kiểm Định Độ Phù Hợp

Phân Rã Tổng Bình Phương

Thành phầnCông thứcĐo lường
SST (Total)Tổng biến động trong Y
SSR (Regression)Biến động được giải thích
SSE (Error)Biến động chưa được giải thích

(Coefficient of Determination)

càng cao → độ phù hợp càng tốt (từ 0 đến 1)

F-Test (kiểm định ý nghĩa tổng thể của mô hình)

Với simple regression: , do đó ,

  • : so với :
  • Bác bỏ nếu (luôn là kiểm định một phía)

t-Test trên Slope ()

t-Test trên Correlation ()

t-Test trên Intercept ()

LOS 10.d — Bảng ANOVA

NguồndfTổng bình phươngBình phương trung bìnhF
RegressionSSR
ErrorSSE
TotalSST

Standard Error of Estimate:

SEE càng nhỏ → độ phù hợp càng tốt.

LOS 10.f — Các Dạng Hàm

Mô hìnhPhương trìnhDiễn giải
Lin-linX tăng 1 đơn vị → Y tăng đơn vị
Log-linX tăng 1 đơn vị → Y tăng
Lin-logX tăng 1% → Y tăng đơn vị
Log-logX tăng 1% → Y tăng (elasticity)

Connections

0 items under this folder.