下列關於迴歸分析變數選擇的敘述,何者正確?
A使用逐步迴歸(stepwise regression)總是能夠得到最正確的模型
B統計不顯著的解釋變數,必須要從模型裡移除掉,否則會影響其他變數的解釋
C當解釋變數很多的時候,可以完全交給逐步迴歸來決定那些變數應該納入模型中
D當解釋變數很多的時候,經由逐步迴歸所挑選出來的變數,其 P 值可能比實際上小正確答案
答案與詳解
逐步迴歸反覆檢定多個變數,屬於多重比較問題。被挑中的變數是「最顯著的那些」,其 P 值呈現樂觀偏誤(被低估),實際顯著性沒那麼強,容易造成型一錯誤膨脹。
