M10 – Simple Linear Regression: CFAI Practice Problems
Source: CFAI CFA1 Quant Practice 2026, pp.310–325 Back to module: M10 Glossary: M10 Terms
Questions 1–3: ROE and Growth Opportunities
The following estimated regression equation relates return on equity (ROE, in %) to growth opportunities (GO, in %):
Question 1
Using this regression, the predicted ROE when is closest to:
- A. 1.8%
- B. 15.8%
- C. 22.0%
Answer
C. 22.0%
Substitute into the regression equation:
Why A is wrong: 1.8% is the slope coefficient, not the predicted value.
Why B is wrong: 15.8% = 4 + 1.8(6.6) — no basis for this.
📖 Giải thích chi tiết
Ôn lại khái niệm: Hồi quy tuyến tính đơn dạng : thay giá trị vào để tính predicted value (giá trị dự báo). = intercept (giá trị khi ), = slope (thay đổi khi tăng 1 đơn vị).
Tại sao C đúng: Thay vào: . Đây là tính toán đơn giản — không được nhầm slope với predicted value. Tại sao A sai: 1.8% là slope coefficient — không phải predicted value. Slope chỉ cho biết mức thay đổi, không phải giá trị dự báo. Tại sao B sai: 15.8% không có cơ sở tính toán từ phương trình này với .
Question 2
The estimated change in ROE when GO changes from 5% to 6% is closest to:
- A. 1.8%
- B. 4.0%
- C. 5.8%
Answer
A. 1.8%
The slope coefficient represents the change in the dependent variable () for a one-unit increase in the independent variable (). A change from 5% to 6% is exactly a 1% increase in GO:
Verification:
- At :
- At :
- Difference: ✓
📖 Giải thích chi tiết
Ôn lại khái niệm: Slope coefficient là đạo hàm của theo : mỗi khi tăng 1 đơn vị, thay đổi đúng đơn vị — bất kể điểm xuất phát là bao nhiêu. Đây là tính chất linear của hồi quy tuyến tính.
Tại sao A đúng: tăng từ 5% lên 6% = tăng 1 đơn vị → . Slope cho biết mỗi 1% tăng GO → ROE tăng 1.8%. Tại sao B sai: 4.0% là intercept — không phải mức thay đổi. Intercept là giá trị khi . Tại sao C sai: 5.8% = intercept (4) + slope (1.8) = nhầm lẫn giữa predicted value khi với mức thay đổi.
Question 3
When and the observed ROE = 21%, the residual is closest to:
- A. −1.8%
- B. 2.6%
- C. 12.0%
Answer
B. 2.6%
The residual is the difference between the observed (actual) value and the predicted (fitted) value:
Step 1 – Predicted ROE at :
Step 2 – Residual:
The positive residual means the actual ROE (21%) exceeds the model’s prediction (18.4%) by 2.6 percentage points.
📖 Giải thích chi tiết
Ôn lại khái niệm: Residual (phần dư) = giá trị thực tế giá trị dự báo: . Residual dương nghĩa là actual cao hơn predicted (model underpredicts). Residual âm nghĩa là actual thấp hơn predicted (model overpredicts). Tổng tất cả residuals trong OLS = 0.
Tại sao B đúng: Bước 1: . Bước 2: Residual = . Residual dương → mô hình underpredicts ROE thực tế. Tại sao A sai: là âm slope một đơn vị — không có logic tính toán cho giá trị này trong bài toán này. Tại sao C sai: — nhầm lẫn giữa residual và predicted value thô.
Question 4
Homoskedasticity is best described as a condition in which the variance of the residuals is:
- A. zero
- B. normally distributed
- C. constant across all observations
Answer
C. constant across all observations
Homoskedasticity (from Greek: homos = same, skedasis = dispersion) is one of the key assumptions of ordinary least squares (OLS) regression. It requires that the variance of the error term is the same for all values of the independent variable:
The violation of this assumption — heteroskedasticity — occurs when residual variance is not constant (e.g., larger at higher values of ). Heteroskedasticity does not bias OLS coefficient estimates but makes standard errors unreliable, invalidating - and -tests.
Why A is wrong: A variance of zero would imply perfect prediction with no error — an unrealistic requirement. OLS does not require zero residuals.
Why B is wrong: The normality assumption is a separate requirement (errors are normally distributed). Normality is distinct from homoskedasticity (constant variance). A distribution can have constant variance without being normal.
📖 Giải thích chi tiết
Ôn lại khái niệm: Giả định homoskedasticity (đồng phương sai) là một trong các giả định cốt lõi của OLS: hằng số với mọi . Vi phạm → heteroskedasticity → standard errors không đáng tin → t-test và F-test không hợp lệ (dù hệ số ước lượng vẫn unbiased).
Tại sao C đúng: Homoskedasticity = variance của error term không đổi qua tất cả các quan sát. Ví dụ sai phạm: variance của sai số lớn hơn với income cao (heteroskedasticity trong data tài chính). Tại sao A sai: Variance bằng 0 = không có sai số = dự báo hoàn hảo — điều này không thực tế và không phải yêu cầu của OLS. Tại sao B sai: Normality (phân phối chuẩn của error) là giả định riêng biệt với homoskedasticity (phương sai không đổi). Một phân phối có thể có variance hằng số mà không cần là phân phối chuẩn.
Questions 5–8: Money Supply Growth and Policy Shift
An analyst regresses money supply growth (%) on an indicator variable SHIFT (= 0 before policy change, = 1 after policy change) using 30 observations.
| Coefficient | Std. Error | -statistic | |
|---|---|---|---|
| [[quantitative-methods/glossary/m10-simple-linear-regression#intercept | Intercept]] | 5.767264 | 0.445229 |
| SHIFT | −5.139120 | 0.629649 | −8.16 |
Critical values: one-tailed ; two-tailed (at 5% significance).
Question 5
The variable SHIFT is best described as:
- A. an indicator variable
- B. the dependent variable
- C. a continuous variable
Answer
A. an indicator variable
SHIFT takes only two values — 0 or 1 — to indicate the presence or absence of the policy change. Variables of this type are called indicator variables, dummy variables, or binary variables. They are used in regression to represent categorical distinctions (before/after, yes/no, group membership).
Why B is wrong: SHIFT is the independent (explanatory) variable. The dependent variable is money supply growth.
Why C is wrong: SHIFT is not continuous — it only takes discrete values of 0 and 1.
📖 Giải thích chi tiết
Ôn lại khái niệm: Indicator variable (dummy variable) là biến nhị phân chỉ nhận giá trị 0 hoặc 1, dùng để mã hóa sự kiện/trạng thái categorical trong hồi quy. Tên gọi khác: binary variable, dummy variable. Rất phổ biến trong finance để mã hóa: trước/sau sự kiện, có/không có thuộc tính, v.v.
Tại sao A đúng: SHIFT chỉ nhận giá trị 0 (trước thay đổi chính sách) hoặc 1 (sau thay đổi) — đây là định nghĩa điển hình của indicator variable. Tại sao B sai: SHIFT là biến độc lập (independent/explanatory variable). Biến phụ thuộc (dependent) là money supply growth — cái mà ta đang cố giải thích/dự báo. Tại sao C sai: SHIFT không phải continuous — nó chỉ nhận hai giá trị rời rạc (0 hoặc 1), không thể nhận mọi giá trị trên một đoạn liên tục.
Question 6
The intercept of 5.767264 represents the mean money supply growth rate:
- A. before the policy shift
- B. over the entire sample period
- C. after the policy shift
Answer
A. before the policy shift
In a regression with a single indicator variable, the intercept () represents the expected (predicted) value of when the indicator = 0.
When (before the policy change):
So the intercept = average money supply growth before the shift.
Why C is wrong: When (after the shift), — this is the predicted growth rate after the shift, not the intercept itself.
📖 Giải thích chi tiết
Ôn lại khái niệm: Trong hồi quy với indicator variable, intercept = giá trị kỳ vọng của khi indicator = 0 (nhóm cơ sở/baseline group). Slope = sự khác biệt trung bình giữa nhóm indicator = 1 và nhóm baseline.
Tại sao A đúng: Khi (trước chính sách): . Intercept = trung bình money supply growth trước khi thay đổi chính sách. Tại sao B sai: Intercept không phải trung bình toàn bộ mẫu — đó sẽ là weighted average của hai giai đoạn, phụ thuộc vào số quan sát mỗi giai đoạn. Tại sao C sai: Trung bình sau chính sách = intercept + slope = . Đây là giá trị dự báo khi SHIFT = 1, không phải intercept.
Question 7
The slope coefficient of −5.139120 is best interpreted as:
- A. the change in money supply growth per year
- B. the average money supply growth rate after the shift
- C. the difference in average money supply growth before versus after the policy change
Answer
C. the difference in average money supply growth before versus after the policy change
The slope on a binary indicator variable measures the difference in the mean of between the two groups ( vs. ):
- Mean growth before shift ():
- Mean growth after shift ():
- Difference (after minus before):
The slope of indicates money supply growth fell by approximately 5.14 percentage points after the policy shift.
Why A is wrong: The variable SHIFT indicates the policy regime, not a time trend. There is no “change per year” interpretation.
Why B is wrong: The mean growth rate after the shift is (intercept + slope), not the slope alone.
📖 Giải thích chi tiết
Ôn lại khái niệm: Khi biến độc lập là indicator variable, slope coefficient mang ý nghĩa đặc biệt: đây là sự khác biệt trung bình của giữa nhóm indicator = 1 và nhóm cơ sở (indicator = 0). Đây không phải “tốc độ thay đổi” theo nghĩa thông thường.
Tại sao C đúng: Slope = (trung bình sau) − (trung bình trước) = . Slope âm chỉ money supply growth giảm ~5.14 percentage points sau khi thay đổi chính sách. Tại sao A sai: SHIFT không phải biến thời gian — nó chỉ biểu thị chế độ chính sách (trước/sau), không có nghĩa “thay đổi mỗi năm”. Tại sao B sai: Trung bình sau chính sách = intercept + slope = . Slope một mình không bằng trung bình sau — phải cộng cả intercept.
Question 8
To test whether money supply growth changed after the policy shift at the 0.05 significance level, the analyst should conclude:
- A. there is sufficient evidence that growth changed after the shift
- B. there is not enough evidence that the slope is different from zero
- C. there is not enough evidence to indicate a change in growth after the shift
Answer
A. there is sufficient evidence that growth changed after the shift
This is a two-tailed test of (no change after shift) vs. (growth changed).
The test statistic is .
The test statistic falls far into the rejection region. Reject — there is strong statistical evidence that money supply growth changed significantly after the policy shift.
Why B and C are wrong: With vastly exceeding the critical value of 2.048, the evidence for a change is overwhelming. The p-value would be essentially zero.
📖 Giải thích chi tiết
Ôn lại khái niệm: Kiểm định (slope = 0, không có thay đổi sau chính sách) vs. là two-tailed test vì “changed” không chỉ định chiều. So sánh với critical value two-tailed tại .
Tại sao A đúng: (critical value two-tailed 5%). Test statistic nằm sâu trong vùng rejection → reject → có bằng chứng mạnh rằng money supply growth đã thay đổi sau chính sách. Tại sao B và C sai: vượt xa critical value 2.048 — không thể “không đủ bằng chứng”. p-value gần như bằng 0, bằng chứng về sự thay đổi là áp đảo.
Questions 9–12: McCoin Regression (CFO/Sales on Net Income/Sales)
Regression of CFO/sales () on net income/sales () using observations:
| Coefficient | Std. Error | -statistic | -value | |
|---|---|---|---|---|
| Intercept | 0.077 | 0.007 | 11.33 | 0.000 |
| Net income/sales | 0.826 | 0.103 | 7.99 | 0.000 |
[[quantitative-methods/glossary/m10-simple-linear-regression#r|]] = 0.7436, SEE = 0.0213,
Question 9
The coefficient of determination for this regression is:
- A. 0.7436
- B. 0.8261
- C. 0.8623
Answer
A. 0.7436
The coefficient of determination is reported directly in the regression output as 0.7436. It indicates that net income/sales explains 74.36% of the variation in CFO/sales across the 24 observations.
Why B is wrong: 0.8261 is close to but not the slope coefficient (0.826) — not .
Why C is wrong: 0.8623 is the correlation coefficient , not itself.
📖 Giải thích chi tiết
Ôn lại khái niệm: [[quantitative-methods/glossary/m10-simple-linear-regression#r|]] (coefficient of determination) = tỷ lệ biến động của được giải thích bởi . Trong simple linear regression: (bình phương của correlation coefficient). luôn nằm trong và được báo cáo trực tiếp trong regression output.
Tại sao A đúng: — đọc trực tiếp từ regression output. Có nghĩa là net income/sales giải thích 74.36% biến động của CFO/sales. Tại sao B sai: 0.8261 gần với slope coefficient (0.826) — nhầm lẫn giữa (slope) và . Tại sao C sai: là correlation coefficient , không phải . , còn .
Question 10
The correlation between net income/sales and CFO/sales is closest to:
- A. −0.7436
- B. 0.7436
- C. 0.8623
Answer
C. 0.8623
The correlation coefficient is related to [[quantitative-methods/glossary/m10-simple-linear-regression#r|]] by:
Since the slope coefficient (0.826) is positive, the correlation is also positive:
Why A is wrong: The negative sign would apply only if the slope were negative.
Why B is wrong: 0.7436 is , not the correlation coefficient. The correlation is the square root of .
📖 Giải thích chi tiết
Ôn lại khái niệm: Mối quan hệ giữa [[quantitative-methods/glossary/m10-simple-linear-regression#r|]] và correlation : . Dấu của = dấu của slope . Bước quan trọng: sau khi tính , phải kiểm tra slope để xác định dấu dương hay âm.
Tại sao C đúng: . Dấu dương vì slope — correlation cùng chiều với slope. Tại sao A sai: Dấu âm chỉ dùng khi slope âm. Ở đây slope = 0.826 > 0 → correlation dương. Tại sao B sai: , không phải . Correlation = căn bậc hai của , không phải chính .
Question 11
If a company’s net income/sales = 5%, the predicted CFO/sales is closest to:
- A. −4.054%
- B. 0.524%
- C. 4.207%
Answer
C. 4.207%
Substitute (i.e., 5%) into the regression equation:
Why A is wrong: −4.054% would result from an arithmetic error or sign error.
Why B is wrong: 0.524% ≈ intercept + slope × 0.54 — not the result for .
📖 Giải thích chi tiết
Ôn lại khái niệm: Tính predicted value (giá trị dự báo): thay giá trị vào phương trình hồi quy . Lưu ý đơn vị: nếu được tính bằng % và phương trình dùng số thập phân hay %, cần nhất quán.
Tại sao C đúng: Thay (5%): . Tại sao A sai: có thể do nhầm dấu hoặc lỗi tính toán. Tại sao B sai: — nhầm lẫn đơn vị khi thay thay vì (khi đã là %, không cần chuyển về decimal).
Question 12
Is the relationship between net income/sales and CFO/sales significant at the 0.05 level?
- A. No, because [[quantitative-methods/glossary/m10-simple-linear-regression#r|]] > 0.05
- B. No, because the p-values of the intercept and slope are less than 0.05
- C. Yes, because the p-values for the F-statistic and the slope coefficient are less than 0.05
Answer
C. Yes, because the p-values for the F-statistic and the slope coefficient are less than 0.05
For a simple linear regression, the F-test (overall model significance) and the t-test for the slope are equivalent. Both test whether the slope differs from zero. With p-values reported as 0.000 for the slope (well below 0.05), the relationship is highly statistically significant.
Why A is wrong: is not compared to to determine significance. describes the explanatory power of the model, not its statistical significance. A model can be statistically significant with low , or statistically insignificant with high in small samples.
Why B is wrong: The conclusion is correct (the relationship is significant), but the reasoning is reversed. p-values below 0.05 support rejecting , confirming significance — not denying it.
📖 Giải thích chi tiết
Ôn lại khái niệm: Kiểm định ý nghĩa thống kê của hồi quy: dùng p-value của slope (t-test) và/hoặc F-statistic (overall model). p-value < → reject → có ý nghĩa thống kê. Không so sánh với — đây là sai lầm phổ biến.
Tại sao C đúng: p-value của slope = 0.000 < 0.05 → reject → mối quan hệ có ý nghĩa thống kê. Trong simple regression, F-test và t-test cho slope là tương đương (F = t²). Tại sao A sai: không được so sánh với để đánh giá significance. mô tả explanatory power (sức giải thích), không phải statistical significance. Tại sao B sai: Kết luận đúng (có ý nghĩa) nhưng lý luận ngược chiều: p-value < 0.05 ủng hộ reject → xác nhận significance — không phải phủ nhận.
Questions 13–17: Stellar Energy vs. CPIENG
Regression of Stellar Energy monthly returns () on CPIENG energy index returns () using monthly observations:
| Coefficient | Std. Error | -statistic | |
|---|---|---|---|
| [[quantitative-methods/glossary/m10-simple-linear-regression#intercept | Intercept]] | 0.0138 | 0.0046 |
| CPIENG | −0.6486 | 0.2818 | −2.3014 |
[[quantitative-methods/glossary/m10-simple-linear-regression#r|]] = 0.0211, [[quantitative-methods/glossary/m10-simple-linear-regression#see|]] = 0.0710 Critical values: one-tailed ; two-tailed (5% significance)
Question 13
This regression is best described as:
- A. a time-series regression
- B. a cross-sectional regression
- C. both a time-series and cross-sectional regression
Answer
A. a time-series regression
The data consists of monthly return observations for one stock (Stellar Energy) over time — this is a time-series dataset. A time-series regression uses observations on the same entity at different points in time.
Why B is wrong: A cross-sectional regression would use observations on multiple different entities at the same point in time (e.g., returns of 248 different stocks in one month).
Why C is wrong: A panel (longitudinal) dataset combines both dimensions (multiple entities over multiple time periods), but this regression uses only one stock’s monthly returns over time.
📖 Giải thích chi tiết
Ôn lại khái niệm: Phân loại dữ liệu hồi quy: Time-series = một thực thể qua nhiều thời điểm; Cross-sectional = nhiều thực thể tại cùng một thời điểm; Panel = nhiều thực thể qua nhiều thời điểm. Nhận diện loại dữ liệu là bước đầu tiên để hiểu context của regression.
Tại sao A đúng: quan sát là monthly returns của cùng một cổ phiếu (Stellar Energy) qua 248 tháng → đây là time-series data → time-series regression. Tại sao B sai: Cross-sectional regression dùng dữ liệu của nhiều thực thể khác nhau tại cùng một thời điểm (ví dụ: returns của 248 cổ phiếu khác nhau trong tháng 1/2024). Tại sao C sai: Panel data kết hợp cả hai chiều (nhiều thực thể × nhiều thời điểm), nhưng ở đây chỉ có một cổ phiếu qua thời gian.
Question 14
If the CPIENG energy index decreases by 1%, the expected return of Stellar Energy is closest to:
- A. 0.73%
- B. 1.38%
- C. 2.03%
Answer
C. 2.03%
When CPIENG changes by (in decimal form matching the regression):
The negative slope means that when CPIENG falls, Stellar Energy’s predicted return rises (inverse relationship).
Why B is wrong: 1.38% is the intercept × 100 only — it ignores the slope’s contribution.
Why A is wrong: 0.73% does not match any correct calculation on these data.
📖 Giải thích chi tiết
Ôn lại khái niệm: Khi slope âm (): giảm → (âm nhân âm = dương) → tăng. Phải cẩn thận về đơn vị: nếu trong decimal thì phải thay vào phương trình.
Tại sao C đúng: (trong decimal, vì phương trình dùng decimal). . Slope âm + CPIENG giảm → Stellar tăng. Tại sao B sai: = chỉ có intercept, bỏ qua đóng góp của slope khi CPIENG thay đổi. Tại sao A sai: không có tính toán hợp lệ từ dữ liệu này.
Question 15
The [[quantitative-methods/glossary/m10-simple-linear-regression#r|]] = 0.0211 indicates that:
- A. Stellar Energy returns explain 2.11% of the variation in CPIENG returns
- B. Stellar Energy returns explain 14.52% of the variation in CPIENG returns
- C. CPIENG returns explain 2.11% of the variation in Stellar Energy returns
Answer
C. CPIENG returns explain 2.11% of the variation in Stellar Energy returns
measures the proportion of the dependent variable’s total variation explained by the independent variable(s). Since Stellar Energy returns are the dependent variable () and CPIENG is the independent variable ():
Despite the statistically significant slope, the regression has very low explanatory power — most of Stellar Energy’s return variation (97.89%) is unexplained by CPIENG alone.
Why A is wrong: The direction of explanation is reversed. measures how much (CPIENG) explains (Stellar), not the other way around.
Why B is wrong: 14.52% corresponds to — this is the absolute value of the correlation coefficient, not .
📖 Giải thích chi tiết
Ôn lại khái niệm: [[quantitative-methods/glossary/m10-simple-linear-regression#r|]] đo lường biến độc lập () giải thích bao nhiêu % biến động của biến phụ thuộc (). Chiều giải thích: giải thích , không phải ngược lại. Lưu ý: một regression có thể statistically significant (slope ≠ 0) nhưng có rất thấp — hai khái niệm này độc lập nhau.
Tại sao C đúng: CPIENG () giải thích 2.11% biến động của Stellar returns (). Mặc dù slope statistically significant, rất thấp — phần lớn biến động của Stellar (97.89%) không được giải thích bởi CPIENG. Tại sao A sai: Đảo ngược chiều giải thích — không đo Stellar giải thích CPIENG, mà là CPIENG giải thích Stellar. Tại sao B sai: 14.52% = — đây là absolute value của correlation coefficient, không phải . .
Question 16
The value 0.0710 (SEE) is the standard deviation of the:
- A. dependent variable
- B. residuals
- C. predicted dependent variable
Answer
B. residuals
The Standard Error of Estimate (SEE) — also called the Root Mean Squared Error (RMSE) — is the standard deviation of the regression residuals:
It measures the typical (average) magnitude of the residuals, i.e., how far actual observations tend to fall from the regression line.
Why A is wrong: The standard deviation of the dependent variable itself would be , which is larger than SEE (since SEE measures unexplained variation only).
Why C is wrong: Predicted values all lie exactly on the regression line — their dispersion around the mean is measured by , not SEE.
📖 Giải thích chi tiết
Ôn lại khái niệm: SEE (Standard Error of Estimate) = độ lệch chuẩn của residuals (phần dư): . SEE càng nhỏ → regression line càng khớp với dữ liệu → dự báo càng chính xác. SEE đo “khoảng cách trung bình” của các điểm thực tế so với đường regression.
Tại sao B đúng: SEE = độ lệch chuẩn của residuals . Đây là ý nghĩa chính xác và quan trọng nhất của SEE. Tại sao A sai: Độ lệch chuẩn của biến phụ thuộc = , lớn hơn SEE vì SST > SSE và dùng thay . Tại sao C sai: Predicted values nằm chính xác trên đường regression — độ phân tán của chúng quanh được đo bởi , không phải SEE.
Question 17
Which of the following conclusions is incorrect?
- A. The intercept is significantly different from zero
- B. After a decline in CPIENG, a positive Stellar return is expected
- C. Both the slope and intercept are not significantly different from zero
Answer
C. Both the slope and intercept are not significantly different from zero
This statement is incorrect (the question asks for the wrong conclusion).
Testing both coefficients using two-tailed critical value :
- Intercept: → significantly different from zero ✓
- Slope (CPIENG): → significantly different from zero ✓
Both coefficients are statistically significant at the 5% level. Statement C falsely claims neither is significant.
Why A is correct (and therefore not the answer): The intercept confirms significance. ✓
Why B is correct (and therefore not the answer): With a negative slope (), a decline in CPIENG () produces a positive predicted change in Stellar return (). Adding the positive intercept (0.0138) confirms an expected positive return. ✓
📖 Giải thích chi tiết
Ôn lại khái niệm: Dạng câu hỏi “which is incorrect?” — phải xác định phát biểu sai (đây là đáp án). Cần kiểm tra từng phát biểu bằng cách tính t-statistic và so với critical value two-tailed .
Tại sao C đúng (là phát biểu sai): Cả intercept () lẫn slope () đều significant ở 5%. Nói “cả hai đều không significant” là sai hoàn toàn. Tại sao A đúng (không phải đáp án): Intercept → significant. Phát biểu A là đúng. Tại sao B đúng (không phải đáp án): Slope âm × CPIENG giảm = đóng góp dương vào return. Cộng intercept dương → expected return dương khi CPIENG giảm. Phát biểu B là đúng.
Questions 18–26: Anh Liu – Short Interest Ratio vs. Debt Ratio
Anh Liu regresses the short interest ratio () on the debt ratio () for companies.
ANOVA Table:
| Source | SS | df | MS |
|---|---|---|---|
| Regression (SSR) | 38.4404 | 1 | 38.4404 |
| Error (SSE) | 373.7638 | 48 | 7.7867 |
| Total (SST) | 412.2042 | 49 | — |
[[quantitative-methods/glossary/m10-simple-linear-regression#r|]] = 0.0933, [[quantitative-methods/glossary/m10-simple-linear-regression#see|]] = 2.7905
| Coefficient | Std. Error | -statistic | |
|---|---|---|---|
| Intercept | 5.4975 | 0.8416 | 6.5322 |
| Debt ratio | −4.1589 | 1.8718 | −2.2219 |
Critical values: one-tailed ; two-tailed (5% significance)
Question 18
Based on the regression results, the scatter plot of short interest ratio vs. debt ratio most likely has:
- A. a horizontal pattern
- B. an upward-sloping pattern
- C. a downward-sloping pattern
Answer
C. a downward-sloping pattern
The slope coefficient on debt ratio is negative (), indicating an inverse relationship — as the debt ratio increases, the short interest ratio tends to decrease. In a scatter plot with a fitted regression line, this produces a downward-sloping (negative) pattern.
Why A is wrong: A horizontal pattern would indicate a slope of zero (no relationship).
Why B is wrong: An upward pattern would require a positive slope coefficient.
📖 Giải thích chi tiết
Ôn lại khái niệm: Slope coefficient quyết định hướng của mối quan hệ trong scatter plot: → upward sloping, → downward sloping, → horizontal (không có quan hệ tuyến tính).
Tại sao C đúng: → khi debt ratio tăng, short interest ratio giảm → scatter plot có xu hướng dốc xuống (downward-sloping). Tại sao A sai: Horizontal pattern = slope = không có quan hệ tuyến tính giữa hai biến. Tại sao B sai: Upward pattern = slope dương. Ở đây slope âm → không thể upward-sloping.
Question 19
The sample covariance between debt ratio and short interest ratio is closest to:
- A. −9.2430
- B. −0.1886
- C. 8.4123
Answer
B. −0.1886
The OLS slope estimator formula provides a relationship between the slope, sample covariance, and sample variance of :
The sample variance of can be recovered from the regression decomposition. However, using the relationship between covariance and :
In this context, the sum .
The sample covariance is:
From the slope formula: .
Since , and , :
Given the answer choices, the sample covariance = .
The value −9.2430 is , while the sample covariance divides by : .
📖 Giải thích chi tiết
Ôn lại khái niệm: Sample covariance = . Phân biệt với (tổng cross-product, chưa chia). Từ OLS slope: , có thể suy ra .
Tại sao B đúng: Từ các đáp án, nhận ra . Giá trị là tổng cross-product (chưa chia), còn sample covariance phải chia . Tại sao A sai: là — tổng cross-product, chưa chia , không phải covariance. Tại sao C sai: — đây là sample variance của (), không phải covariance.
Question 20
The correlation between debt ratio and short interest ratio is closest to:
- A. −0.3054
- B. 0.0933
- C. 0.3054
Answer
A. −0.3054
The sign matches the slope coefficient: since , the correlation is negative:
Why B is wrong: 0.0933 is [[quantitative-methods/glossary/m10-simple-linear-regression#r|]], not the correlation coefficient.
Why C is wrong: The magnitude is correct but the sign is wrong. The negative slope confirms a negative correlation.
📖 Giải thích chi tiết
Ôn lại khái niệm: — dấu của phải khớp với dấu của slope . Đây là bước thường bị bỏ qua: tính rồi gán dấu đúng dựa trên slope.
Tại sao A đúng: . Slope → correlation âm. Magnitude: . Tại sao B sai: , không phải . Correlation = căn bậc hai của . Tại sao C sai: Magnitude đúng () nhưng dấu sai — slope âm → correlation phải âm (), không phải dương.
Question 21
Which interpretation best describes the findings of Anh Liu’s regression?
- A. Interpretation 1: Higher debt ratios cause lower short interest ratios
- B. Interpretation 2: Higher short interest ratios cause companies to take on more debt
- C. Interpretation 3: Companies with higher debt ratios tend to have lower short interest ratios
Answer
C. Interpretation 3: Companies with higher debt ratios tend to have lower short interest ratios
Regression analysis establishes association, not causation. The correct interpretation of a negative slope in OLS is that higher values of (debt ratio) are associated with lower values of (short interest ratio) — not that one causes the other.
Why A is wrong: Claiming causation (“cause”) requires controlled experiments or additional analysis (e.g., natural experiments, instrumental variables). Cross-sectional regression alone cannot establish a causal link.
Why B is wrong: The regression is estimated with debt ratio as the independent variable and short interest as the dependent variable — not the other way around. Furthermore, both reverse causation and the “association only” principle apply here.
📖 Giải thích chi tiết
Ôn lại khái niệm: Hồi quy chỉ đo lường association (tương quan/liên kết), không phải causation (nhân quả). “Correlation ≠ Causation” là nguyên tắc cốt lõi trong thống kê. Chỉ có randomized controlled experiments hoặc phân tích nhân quả đặc biệt mới có thể kết luận nhân quả.
Tại sao C đúng: Phát biểu đúng là “tend to have” — dùng ngôn ngữ của association, không phải causation. Công ty có debt ratio cao có xu hướng có short interest ratio thấp. Tại sao A sai: “Cause” (gây ra) ngụ ý nhân quả — regression cross-sectional không đủ để kết luận nhân quả. Có thể có confounding variables hoặc reverse causation. Tại sao B sai: Ngoài vấn đề nhân quả, câu B còn đảo ngược chiều của regression (debt ratio là , short interest là ) và giả định reverse causation không có cơ sở.
Question 22
The dependent variable in Anh Liu’s regression is:
- A. the intercept
- B. the debt ratio
- C. the short interest ratio
Answer
C. the short interest ratio
The dependent variable () is the variable being explained or predicted by the regression. Anh Liu is regressing short interest ratio on debt ratio, meaning:
- Dependent variable (): short interest ratio (left-hand side)
- Independent variable (): debt ratio (right-hand side)
The intercept is not a variable — it is a coefficient in the regression equation.
📖 Giải thích chi tiết
Ôn lại khái niệm: Trong phương trình : biến phụ thuộc () là cái ta đang cố giải thích/dự báo (nằm bên trái dấu =); biến độc lập () là biến giải thích (nằm bên phải); intercept () và slope () là các hệ số (coefficients), không phải biến.
Tại sao C đúng: “Regress short interest ratio on debt ratio” → short interest ratio là (dependent variable), debt ratio là (independent variable). Tại sao B sai: Debt ratio là biến độc lập (, biến giải thích), không phải dependent variable. Tại sao A sai: Intercept là hệ số trong phương trình, không phải biến. Intercept () là giá trị dự báo của khi .
Question 23
The degrees of freedom for the -test of the slope coefficient are:
- A. 48
- B. 49
- C. 50
Answer
A. 48
For simple linear regression with observations, the degrees of freedom for the -test of any coefficient (intercept or slope) are:
Two degrees of freedom are lost because two parameters are estimated: (intercept) and (slope). This matches the error degrees of freedom in the ANOVA table ().
📖 Giải thích chi tiết
Ôn lại khái niệm: Degrees of freedom (df) trong t-test của regression = với = số biến độc lập. Simple linear regression có → . Hai df bị mất vì phải ước lượng hai tham số: (intercept) và (slope). Đây cũng bằng trong ANOVA table.
Tại sao A đúng: . Mỗi tham số ước lượng “tiêu tốn” 1 degree of freedom. Tại sao B sai: — chỉ mất 1 df, dùng cho variance tổng () hay khi chỉ ước lượng 1 tham số (như sample mean). Không đúng cho t-test của slope/intercept. Tại sao C sai: — không mất df nào, không thực tế trong kiểm định thống kê.
Question 24
Which conclusion is most supported by Anh Liu’s results?
- A. The average short interest ratio in the sample is 5.4975
- B. The slope coefficient is different from zero at the 0.05 significance level
- C. The debt ratio explains 30.54% of the variation in the short interest ratio
Answer
B. The slope coefficient is different from zero at the 0.05 significance level
Testing vs. (two-tailed):
Reject — the slope is statistically significantly different from zero at the 5% level.
Why A is wrong: The intercept (5.4975) is the predicted short interest ratio when debt ratio = 0, not the sample mean. The sample mean would be computed from the raw data. (In fact, , which is not necessarily equal to the intercept unless .)
Why C is wrong: The debt ratio explains [[quantitative-methods/glossary/m10-simple-linear-regression#r|]] = 9.33% of the variation in short interest, not 30.54%. The value 30.54% corresponds to (the correlation), not .
📖 Giải thích chi tiết
Ôn lại khái niệm: Ba bẫy thường gặp trong câu hỏi về regression: (1) nhầm intercept với sample mean ; (2) nhầm với ; (3) nhầm significant hay không bằng cách so sánh |t| với critical value.
Tại sao B đúng: (critical value two-tailed 5%) → reject → slope khác 0 có ý nghĩa thống kê ở mức 5%. Tại sao A sai: Intercept là predicted khi , không phải sample mean . — chỉ bằng intercept khi . Tại sao C sai: Debt ratio giải thích biến động, không phải 30.54%. Giá trị 30.54% là (correlation), không phải .
Question 25
MQD Corp has a debt ratio of 0.40. The predicted short interest ratio is closest to:
- A. 3.8339
- B. 5.4975
- C. 6.2462
Answer
A. 3.8339
Why B is wrong: 5.4975 is the predicted value when debt ratio = 0 (the intercept), not when debt ratio = 0.40.
Why C is wrong: 6.2462 would result from adding (rather than subtracting) the slope contribution, i.e., — a sign error.
📖 Giải thích chi tiết
Ôn lại khái niệm: Tính predicted value cho giá trị cụ thể: thay vào . Cẩn thận với dấu âm của slope — luôn giữ nguyên dấu trong tính toán. Với slope âm, tăng làm giảm .
Tại sao A đúng: . Slope âm → debt ratio 0.40 làm giảm predicted short interest ratio. Tại sao B sai: = predicted value khi (intercept), không phải khi . Tại sao C sai: — bỏ dấu âm của slope → tính sai hướng (cộng thay vì trừ).
Question 26
The F-statistic for testing the overall significance of the regression is closest to:
- A. −2.2219
- B. 3.5036
- C. 4.9367
Answer
C. 4.9367
The F-statistic is the ratio of the mean square regression (MSR) to the mean square error (MSE):
where (one independent variable in simple regression).
Why A is wrong: −2.2219 is the t-statistic for the slope coefficient, not the F-statistic. Note: for simple regression: ✓ — this confirms the calculation.
Why B is wrong: 3.5036 does not correspond to any standard calculation from these data.
📖 Giải thích chi tiết
Ôn lại khái niệm: F-statistic = . Trong simple regression (): . Quan hệ quan trọng: trong simple regression (F-test và t-test cho slope tương đương).
Tại sao C đúng: . Kiểm tra: ✓ — xác nhận kết quả. Tại sao A sai: là t-statistic của slope, không phải F-statistic. F-statistic luôn dương (vì là tỷ số hai variance dương). Tại sao B sai: không tương ứng với bất kỳ tính toán chuẩn nào từ dữ liệu này.
Questions 27–29: US CPI Regression (Forecasting Bias)
Olabudo regresses actual CPI () on forecast CPI () using observations. An unbiased forecast model should have intercept = 0 and slope = 1.
| Coefficient | Std. Error | -statistic | |
|---|---|---|---|
| [[quantitative-methods/glossary/m10-simple-linear-regression#intercept | Intercept]] | 0.0001 | 0.0002 |
| Slope | 0.9830 | 0.0155 | 63.4194 |
[[quantitative-methods/glossary/m10-simple-linear-regression#r|]] = 0.9859, [[quantitative-methods/glossary/m10-simple-linear-regression#see|]] = 0.0009, -critical (two-tailed, 5%) , CPI forecast for next period:
Question 27
Based on the regression results, Olabudo should:
- A. conclude that the CPI forecasts are unbiased
- B. reject that the slope coefficient equals 1
- C. reject that the intercept is equal to 0
Answer
A. conclude that the CPI forecasts are unbiased
An unbiased forecast requires two conditions:
- Intercept = 0
- Slope = 1
Test for intercept = 0:
→ Fail to reject ✓
Test for slope = 1:
→ Fail to reject ✓
Both conditions for unbiasedness are consistent with the data. Olabudo cannot reject either → the forecasts appear unbiased.
Why B is wrong: The slope test statistic of −1.097 is within the critical bounds, so we fail to reject the hypothesis that slope = 1.
Why C is wrong: The intercept test statistic of 0.5000 is well within the critical bounds, so we fail to reject the hypothesis that intercept = 0.
📖 Giải thích chi tiết
Ôn lại khái niệm: Để kiểm định unbiased forecast: cần kiểm định đồng thời hai điều kiện: (intercept = 0) và (slope = 1). Lưu ý: test slope = 1 dùng , không phải .
Tại sao A đúng: (1) Test intercept = 0: , → fail to reject. (2) Test slope = 1: , → fail to reject. Cả hai điều kiện unbiased đều không bị bác bỏ → kết luận forecasts appear unbiased. Tại sao B sai: , → fail to reject (không phải reject). B nói “reject” là sai. Tại sao C sai: , → fail to reject . C nói “reject” là sai.
Question 28
The 99% prediction interval for the actual CPI when the forecast is 2.8 is closest to:
- A. 2.7506 to 2.7544
- B. 2.7521 to 2.7529
- C. 2.7981 to 2.8019
Answer
A. 2.7506 to 2.7544
Step 1 – Point prediction:
Step 2 – Prediction interval standard error:
Step 3 – 99% prediction interval (using for simplicity):
This matches option A.
📖 Giải thích chi tiết
Ôn lại khái niệm: Prediction interval (PI) cho giá trị mới: , với . PI rộng hơn confidence interval vì có thêm số “1” trong dấu ngoặc (uncertainty của một quan sát mới).
Logic tính toán: Bước 1: . Bước 2: Tính với SEE = 0.0009, , , . Bước 3: . Tại sao A đúng: Khoảng khớp với tính toán PI 99%. Tại sao B sai: quá hẹp — có thể là confidence interval (cho mean ), không phải prediction interval (cho một mới). Tại sao C sai: xoay quanh thay vì — nhầm CPI forecast với predicted CPI actual.
Question 29
Which observation about forecasting from this regression is correct?
- A. Only Observation 1
- B. Only Observation 2
- C. Both observations
Observation 1: The width of a prediction interval is the same regardless of how far the forecast value is from the sample mean. Observation 2: A larger SEE leads to a wider confidence interval for the predicted value.
Answer
B. Only Observation 2
Observation 1 is incorrect: The prediction interval formula includes the term , which increases as the new observation moves further from the sample mean . Prediction intervals are narrowest at and widen as departs from the mean.
Observation 2 is correct: A larger increases (which includes as a multiplier), directly widening the prediction (and confidence) interval:
A higher SEE linearly increases , and hence the width of the interval ().
📖 Giải thích chi tiết
Ôn lại khái niệm: Prediction interval hẹp nhất khi (điểm trung tâm mẫu) và rộng ra khi xa . Điều này do số hạng trong công thức . SEE ảnh hưởng tuyến tính đến (và vuông đến ).
Tại sao B đúng (chỉ Observation 2): Observation 1 sai: Prediction interval không có chiều rộng cố định — số hạng làm PI rộng ra khi xa . Đây là lý do extrapolation (dự báo ngoài range của mẫu) rất rủi ro. Observation 2 đúng: SEE lớn hơn → lớn hơn → PI rộng hơn. SEE là thừa số trong nên ảnh hưởng trực tiếp đến độ rộng của interval.
Questions 30–34: Amtex and Crude Oil Returns
Regression of Amtex monthly returns () on crude oil monthly returns () using observations.
| Coefficient | Std. Error | |
|---|---|---|
| Intercept | 0.0095 | 0.0078 |
| Oil return | 0.2354 | 0.0760 |
Critical values at 1%: one-tailed ; two-tailed Expected oil return for month 37: ;
Question 30
Which of the following regression assumptions is incorrectly stated?
- A. Assumption 1: The error term is not correlated with the independent variable
- B. Assumption 2: The variance of the error term is constant (homoskedasticity)
- C. Assumption 3: The dependent variable is normally distributed
Answer
C. Assumption 3: The dependent variable is normally distributed
The standard OLS regression assumption is that the error term () is normally distributed — not the dependent variable . While will also be normally distributed if is normal (since ), the normality assumption applies to the error term.
Stating the assumption as “the dependent variable is normally distributed” is incorrect because it conflates the error term with the outcome variable.
The six classical OLS assumptions:
- Linear relationship between and
- values are independent (no perfect multicollinearity)
- Error term has zero expected value:
- Error term is not correlated with (no endogeneity)
- Homoskedasticity: (constant)
- Error term is normally distributed:
📖 Giải thích chi tiết
Ôn lại khái niệm: 6 giả định OLS cổ điển — giả định normality áp dụng cho error term (), không phải cho . Tuy nhiên, nếu và thì cũng sẽ có phân phối chuẩn (với cố định). Nhưng phát biểu chuẩn luôn là về .
Tại sao C đúng (là phát biểu sai): Giả định đúng là error term () có phân phối chuẩn, không phải dependent variable . Viết “dependent variable normally distributed” là sai về mặt kỹ thuật và nhầm lẫn giữa và . Tại sao A đúng (không phải đáp án): Error term không tương quan với (no endogeneity) — đây là giả định đúng và quan trọng của OLS. Tại sao B đúng (không phải đáp án): Homoskedasticity: hằng số — đây là giả định đúng của OLS.
Question 31
The standard error of estimate (SEE) is closest to:
- A. 0.04456
- B. 0.04585
- C. 0.05018
Answer
B. 0.04585
Why A is wrong: 0.04456 would result from using instead of in the denominator.
Why C is wrong: 0.05018 ≈ — incorrect degrees of freedom.
📖 Giải thích chi tiết
Ôn lại khái niệm: SEE = = . Mẫu số luôn là cho simple linear regression (mất 2 df do ước lượng intercept và slope). Đây là lỗi phổ biến: nhầm (variance mẫu thông thường) với (SEE của regression).
Tại sao B đúng: . Dùng đúng cho simple regression. Tại sao A sai: — dùng thay vì . Nhầm với công thức sample standard deviation thông thường. Tại sao C sai: Dùng sai degrees of freedom — không có cơ sở toán học cho .
Question 32
Vasileva should reject the null hypothesis that:
- A. the slope coefficient is less than or equal to 0.15
- B. the intercept is less than or equal to 0
- C. crude oil returns do not explain Amtex returns
Answer
C. crude oil returns do not explain Amtex returns
Testing vs. (two-tailed at 1%):
→ Reject at the 1% level. The slope is significantly different from zero — crude oil returns do explain Amtex returns.
Why A is wrong: Testing vs. (one-tailed at 1%, critical = 2.441):
→ Fail to reject .
Why B is wrong: Testing vs. (one-tailed at 1%, critical = 2.441):
→ Fail to reject .
📖 Giải thích chi tiết
Ôn lại khái niệm: Câu hỏi này yêu cầu tính t-statistic cho từng null hypothesis và so với critical value phù hợp (one-tailed vs two-tailed, 1% significance). Kỹ năng quan trọng: phân biệt (two-tailed nếu ) với (one-tailed nếu ).
Tại sao C đúng: Test (two-tailed, 1%): → reject → kết luận crude oil explains Amtex returns. Tại sao A sai: Test (one-tailed, 1%): → fail to reject. Không đủ bằng chứng để kết luận slope > 0.15. Tại sao B sai: Test (one-tailed, 1%): → fail to reject. Không đủ bằng chứng để kết luận intercept > 0 ở mức 1%.
Question 33
The predicted Amtex return for month 37, when the expected crude oil return is −1%, is closest to:
- A. −0.0024
- B. 0.0071
- C. 0.0119
Answer
B. 0.0071
The positive intercept (0.0095) partially offsets the negative contribution from the oil return term, resulting in a small positive predicted return.
📖 Giải thích chi tiết
Ôn lại khái niệm: Tính predicted value: thay (giá trị âm) vào . Lưu ý: (slope dương) nên oil return âm → đóng góp âm vào predicted return. Intercept dương bù lại một phần.
Tại sao B đúng: . Oil return âm nhưng intercept dương bù lại → predicted return nhỏ dương. Tại sao A sai: là kết quả âm — có thể do nhầm dấu hoặc bỏ intercept. Tại sao C sai: — nhầm thay vì , hoặc nhầm đơn vị.
Question 34
The 99% prediction interval for the Amtex return in month 37 is closest to:
- A.
- B.
- C.
Answer
C.
The prediction interval is:
At 99% confidence (1% significance level, two-tailed), the critical value is and :
Why A is wrong: 0.0053 ≈ SEE × (using SEE instead of , which understates interval width by ignoring the prediction uncertainty component).
Why B is wrong: 0.0469 is itself — the half-width must be multiplied by the critical value .
📖 Giải thích chi tiết
Ôn lại khái niệm: Prediction interval = . Half-width = — cần nhân với critical value , không phải dùng trực tiếp. Critical value lấy theo confidence level và .
Tại sao C đúng: Half-width = . PI = . Đây là interval rộng — phản ánh độ không chắc chắn lớn khi dự báo return của một tháng cụ thể. Tại sao A sai: — nhầm dùng SEE thay vì (SEE < vì còn tính thêm uncertainty của một quan sát mới). Tại sao B sai: — đây là standard error của prediction, chưa nhân với critical value . Half-width phải là .
Questions 35–38: NPM vs. Fixed Asset Turnover (Log-Lin Model)
Tremblay estimates the log-linear regression:
ANOVA Table:
| Source | SS | df | -value | |
|---|---|---|---|---|
| Regression | 102.9152 | 1 | 1486.7079 | 0.0000 |
| Error | 2.2152 | 32 | ||
| Total | 105.1303 | 33 |
| Coefficient | Std. Error | -statistic | -value | |
|---|---|---|---|---|
| Intercept | 0.5987 | 0.0561 | 10.6749 | 0.0000 |
| FATO | 0.2951 | 0.0077 | 38.5579 | 0.0000 |
Question 35
The coefficient of determination () is closest to:
- A. 0.0211
- B. 0.9789
- C. 0.9894
Answer
B. 0.9789
FATO explains approximately 97.9% of the variation in across the 34 observations — an extremely strong fit.
Why A is wrong: 0.0211 is the from the Stellar/CPIENG regression (Questions 13–17), not this regression.
Why C is wrong: 0.9894 — this would be the correlation coefficient , not .
📖 Giải thích chi tiết
Ôn lại khái niệm: [[quantitative-methods/glossary/m10-simple-linear-regression#r|]] từ ANOVA table: . Đây là công thức trực tiếp từ bảng ANOVA — không cần tính thêm gì. Lưu ý: SST = SSR + SSE.
Tại sao B đúng: . FATO giải thích 97.89% biến động của — fit rất tốt. Tại sao A sai: là của regression Stellar/CPIENG (Q13-17) — nhầm lẫn giữa các bài toán. Cần đọc kỹ context của từng scenario. Tại sao C sai: = correlation coefficient , không phải . Nhớ: , .
Question 36
The standard error of estimate (SEE) is closest to:
- A. 0.2631
- B. 1.7849
- C. 38.5579
Answer
A. 0.2631
Why B is wrong: 1.7849 ≈ — no standard formula produces this.
Why C is wrong: 38.5579 is the -statistic for the FATO slope coefficient, not the SEE.
📖 Giải thích chi tiết
Ôn lại khái niệm: SEE = . Trong ANOVA table, = Mean Square Error. (với quan sát, biến độc lập).
Tại sao A đúng: . Đọc và từ ANOVA table. Tại sao B sai: không có công thức chuẩn nào tạo ra từ bảng ANOVA này. Tại sao C sai: là t-statistic của slope FATO, không phải SEE. Đây là cột khác trong regression output — không nhầm lẫn giữa t-statistic và SEE.
Question 37
At the 0.01 significance level, Jones should conclude that:
- A. the mean NPM is 0.5987%
- B. variation in FATO explains variation in
- C. a change in FATO from 3 to 4 leads to a change in NPM of 0.5987%
Answer
B. variation in FATO explains variation in
The p-value for both the slope coefficient and the F-statistic is 0.0000 — vastly below the 1% significance level. Reject and conclude that FATO has a highly significant, positive relationship with .
Why A is wrong: The intercept of 0.5987 is the value of when (i.e., ). It is not the mean NPM in percentage terms.
Why C is wrong: In a log-linear model, the slope has a multiplicative interpretation. A one-unit increase in FATO (from 3 to 4) changes by 0.2951, not 0.5987. Furthermore, the change in NPM is multiplicative: relative change, not an absolute change of 0.5987%.
📖 Giải thích chi tiết
Ôn lại khái niệm: Log-linear model: . p-value = 0.0000 cho slope → reject → FATO có ý nghĩa thống kê trong giải thích . Phân biệt: kết luận về vs. kết luận về gốc.
Tại sao B đúng: p-value của slope FATO = 0.0000 < 0.01 → reject ở mức 1%. Kết luận: biến thiên của FATO giải thích biến thiên của — phát biểu chính xác theo ngôn ngữ của log-linear model. Tại sao A sai: Intercept là giá trị khi , tức . Đây không phải “mean NPM = 0.5987%”. Tại sao C sai: Hai lỗi: (1) Slope của thay đổi FATO từ 3→4 là (slope), không phải (intercept); (2) Trong log-linear model, tác động lên gốc là multiplicative: , không phải 0.5987%.
Question 38
The predicted NPM for a company with is closest to:
- A. 1.1889%
- B. 1.8043%
- C. 3.2835%
Answer
C. 3.2835%
Step 1 – Predict :
Step 2 – Convert back to NPM:
Why A is wrong: 1.1889 is the predicted value of , not NPM itself. The final step of exponentiating is required.
Why B is wrong: 1.8043 ≈ (only the slope component exponentiated, omitting the intercept).
📖 Giải thích chi tiết
Ôn lại khái niệm: Trong log-linear model, để tính predicted NPM (gốc), cần hai bước: (1) Tính ; (2) Exponential transformation: . Bước 2 thường bị quên — đây là bẫy phổ biến nhất trong log-linear model.
Tại sao C đúng: Bước 1: . Bước 2: . Tại sao A sai: là giá trị — bỏ qua bước exponentiate. Đây là lỗi phổ biến nhất: nhầm với . Tại sao B sai: — chỉ exponentiate phần slope (), bỏ qua intercept . Phải exponentiate tổng , không phải chỉ một phần.