Module 3: Statistical Measures of Asset Returns
Nguồn: SAPP Quant 2026 trang 113–178
Learning Outcomes
| LOS | Mô tả |
|---|---|
| Pre.i | Xác định và so sánh các loại dữ liệu |
| Pre.ii | Cách tổ chức dữ liệu cho phân tích định lượng |
| Pre.iii | Phân phối tần số và các phân phối liên quan |
| Pre.iv–vi | Bảng phân loại chéo (contingency tables), trực quan hóa dữ liệu, các loại biểu đồ |
| 3.a | Các thước đo xu hướng trung tâm và vị trí |
| 3.b | Các thước đo phân tán |
| 3.c | Skewness và kurtosis |
| 3.d | Correlation giữa hai biến |
Phân Loại Dữ Liệu
Theo Góc Độ Thống Kê
| Numerical (Định lượng) | Categorical (Định tính) |
|---|---|
| Discrete: có thể đếm được, số lượng hữu hạn (ví dụ: số lượng cổ phiếu) | Nominal: không có thứ tự logic (ví dụ: ngành của cổ phiếu) |
| Continuous: có thể đo lường, phạm vi vô hạn (ví dụ: lượng mưa) | Ordinal: có thứ tự logic (ví dụ: xếp hạng top 100 cổ phiếu) |
Theo Phương Thức Thu Thập
| Time Series | Cross-Sectional | Panel |
|---|---|---|
| Cùng một biến theo thời gian | Nhiều biến tại một thời điểm | Nhiều biến theo thời gian cho nhiều đối tượng |
| Ví dụ: lợi suất hàng tháng của FPT 2017–2022 | Ví dụ: lợi suất của FPT, MWG,… ngày 1/1 | Ví dụ: tỷ lệ D/E của 20 công ty trong 24 quý |
Theo Cách Tổ Chức
- Structured: có tổ chức, mẫu lặp lại (dữ liệu thị trường, báo cáo tài chính)
- Unstructured: không có định dạng chuẩn (mạng xã hội, ảnh vệ tinh)
Các Thước Đo Xu Hướng Trung Tâm (LOS 3.a)
| Thước đo | Công thức | Phù hợp nhất |
|---|---|---|
| Arithmetic Mean | Tính trung bình thông thường | |
| Trimmed Mean | Loại bỏ cao nhất/thấp nhất, rồi lấy trung bình | Giảm tác động của giá trị ngoại lai |
| Winsorized Mean | Thay các giá trị cực đoan bằng giá trị không cực đoan gần nhất, rồi lấy trung bình | Giữ nguyên toàn bộ điểm dữ liệu |
| Median | Giá trị ở giữa khi sắp xếp theo thứ tự | Phân phối lệch (skewed distributions) |
| Mode | Giá trị xuất hiện nhiều nhất | Dữ liệu định tính |
Các Thước Đo Phân Tán (LOS 3.b)
| Thước đo | Công thức |
|---|---|
| Range | |
| MAD | |
| Population Variance | |
| Sample Variance | |
| Standard Deviation | hoặc |
| CV (Coefficient of Variation) | |
| Target Downside Deviation |
Skewness và Kurtosis (LOS 3.c)
Skewness đo lường tính bất đối xứng:
- : lệch phải (positive skew) — mean > median > mode
- : lệch trái (negative skew) — mean < median < mode
- : phân phối đối xứng
Kurtosis đo lường độ dày của đuôi phân phối:
- Leptokurtic (excess kurtosis > 0): đuôi béo, nhiều kết quả cực đoan hơn
- Mesokurtic (excess kurtosis = 0): phân phối chuẩn (normal distribution)
- Platykurtic (excess kurtosis < 0): đuôi mỏng
Đối với nhà đầu tư: phân phối leptokurtic đồng nghĩa với xác suất cao hơn để xảy ra các mức lợi suất cực đoan (cả lãi lớn lẫn lỗ lớn)
Correlation (LOS 3.d)
- : tương quan dương tuyệt đối (perfect positive linear relationship)
- : không có mối quan hệ tuyến tính
- : tương quan âm tuyệt đối (perfect negative linear relationship)
Hạn chế: correlation chỉ đo lường mối quan hệ tuyến tính và có thể bị bóp méo bởi các giá trị ngoại lai
Liên Kết
- Liên quan: Data Types, Frequency Distribution
- Mở rộng sang: M05 — Portfolio Math (covariance, correlation trong bối cảnh danh mục đầu tư)
- Công thức: All M03 Formulas