工程項目管理系統(tǒng) | OA系統(tǒng) | ERP系統(tǒng) | 工程項目管理軟件 | 裝飾管理系統(tǒng) | 簽約案例 | 購買價格 | 在線試用 | 手機APP | 產品資料
X 關閉
項目管理系統(tǒng)

當前位置:工程項目OA系統(tǒng) > 建筑OA系統(tǒng) > 項目管理系統(tǒng)

論最小二乘法回歸分析中的幾個問題

申請免費試用、咨詢電話:400-8352-114


  回歸分析方法是常用的數理統(tǒng)計方法,它用來處理變量之間的相關關系,在科學研究、工程技術等各個領域均有廣泛的應用。由于回歸分析是通過試驗數據研究變量之間的相關關系,故使用此方法時,需要判斷相關關系是否密切(對回歸方程進行顯著性檢驗)。水文計算的一些文獻[1][2]中,指出相關系數的絕對值|r|>0.8作為判別標準,而沒有明確使用此標準的前提。另外,使用最小二乘估計,有時盡管回歸方程顯著,但回歸方程中回歸系數的符號與實際問題不符,即回歸系數出現錯誤符號,顯然這種情況下的回歸方程是不能使用的。本文針對相關系數的絕對值|r|>0.8判別標準的來歷以及回歸系數錯誤符號的原因分析等進行論述,以期達到回歸方法的正確使用。

  1 相關系數臨界值0.8的來歷

   水文上,常用0.8作為判別相關關系是否密切的監(jiān)界值。例如文獻[1][2]中均提到相關系數絕對值|r|>0.8時,認為相關密切。事實上,這一標準是針對一元線性回歸觀察值組數n≥10時的一種簡便的判別方法,不具有普遍意義。若忽略了n≥10這一條件,則可能會導致錯誤的結論。關于這一點可以從相關系數顯著性檢驗制成的相關系數臨界值表中容易得到解釋。

   對于多元線性回歸,F檢驗法的統(tǒng)計量F和復相關系數R分別為[3]

  

  式中?。睢^測數據組數

   ?。怼宰兞總€數

    u——回歸平方和

   ?。选獨埐钇椒胶?/p>

   設顯著性水平為a、自由度為(m,n-m-1)的F檢驗法的臨界值為:F(m,n-m-1),并簡記為F,利用式(1)(2)可以導出F≥F等價于:

  

   時相關系數靈敏檢驗法的臨界值,以下簡記為R

   當R≥R時,線性回歸方程顯著。

   對于一元線性回歸,令R(n-2)=r,簡單線性相關系數r=u/(Q+u),|r|=R,當|r|≥r時,線性回歸方程顯著。

   對于Ra已制成相關系數檢驗臨界值表[3,4]。以一元線性回歸為便,由此表可得表1中的數據。

  

  可見,當a=0.01,n=10,|r|≥0.765≈0.8,回歸方程效果顯著。

   由上表可知,當a=0.01,n≥10時,|r|>0.8>r。即n>10時,r<0.8。在水文計算中回歸分析用于插補延長系列,從避免有較大誤差提高設計成果精度的角度,將n≥10時|r|>0.8作為相關密切的簡易判別標準。但絕不能不問n等于多少,而籠統(tǒng)地認為只要|r|>0.8,則相關密切。

   同時,還應注意,相同a相關系數臨界值Ra將隨自變量個數m的增大而增大。便如對于三元線性回歸,當n=10時,由文獻[4]中相關系數臨界值表可查得a=0.01時,R0.01=0.911。切忌不分具體情況,一概而論,盲目使用|r|>0.8的判別標準。

   2 回歸系數錯誤符號的原因及分析方法

   為討論方便,需引進一般多元線性回歸模型

  

    通常稱X為多元回歸模型的設計陣。

   最小二乘原則確定回歸系數具有良好的性質,例如當假設ε~N(0,σ)時,可對回歸方程進行顯著性檢驗,經驗回歸系數是理論回歸系數的無偏估計量等。但最小二乘估計有時會出現某些自變量的回歸系數的符號與實際問題不符的不合理現象,以下實例就說明了這一點。

   某承壓水漏斗區(qū)漏斗中心歷年最低水位、歷年開采量資料見表2。漏斗中心最低水位出現在每年6月底、7月初。利用水均衡方程分析表明,影響第t+1年漏斗中心最低水位的主要因素為第t年漏斗中心最低水位和第t年漏斗區(qū)開采量。根據1976~1995年數據建立線性回歸方程為:

   h(t+1)=0.8963 h(t)+0.0150 Q(t)-9.3952?。ǎ担?/p>

   式中h(t)、h(t+1)分別為第t年、第t+1年漏斗中心年最低水位m; Q(t)為第t年年開采量,106m

   從物理成因上分析容易得出,開采量對漏斗中心最低水位的影響為負相關,即開采量越大,漏斗中心水位越低,但回歸方程中Q(t)的系數卻為正值,顯然是不合理的。盡管式(5)經過顯著性檢驗回歸效果顯著(復相關系數R=0.969,相關系數臨界值R0.01=0.662),但這樣的模型是不符合實際的。

  

  為什么回歸系數會出現錯誤符號?理論分析[5]和實踐均表明,當設計陣X接近奇異時,正規(guī)方程組的唯一解雖然存在,但最小二乘估計的性能會變壞。X接近奇異,也就是X的列向量接近線性相關,這種自變量之間的近似線性關系,稱為復共線關系,或復共線性。復共線關系的存在是回歸系數錯誤符號的主要原因。

   判斷設計陣復共線性關系的簡便方法是計算自變量之間的相關系數。實例中h(t)與Q(t)的樣本相關系數為-0.90,有近似線性關系,也即設計陣X的列向量接近線性相關,這正是導致式(5)回歸系數錯誤符號的原因。

   對于復共線關系存在且各自變量確實對倚變量均影響顯著,則應該用其它回歸方法,例如嶺回歸、殘差絕對值準則回歸等,不能將回歸系數存在錯誤符號的回歸方程應用于實際。

   3 結語

   本文論述了水文計算中采用相關系數0.8作為相關是否密切的判別標準的來歷和使用條件,指出此標準并不具備普遍意義。結合實例分析了導致回歸系數錯誤符號的原因,給出了判斷設計陣存在復共線性的簡易方法。搞清這些對于正確使用最小二乘法回歸計算,進行有效的數據分析,將具有重要的意義。

  參考文獻

  ?1?蔣金珠.工程水文及水利計算?M?.北京:水利電力出版社,1992.

   ?2?殷兆熊.水文水利計算?M?.北京:中國水利水電出版社,1994.

   ?3?王俊德.水文統(tǒng)計?M?.北京:水利水電力出版社,1993.

   ?4?費勤貴.水文統(tǒng)計學?M?.北京:水利電力出版社,1991.

   ?5?方開泰.實用回歸分析?M?.北京:科學出版社,1988.

 
發(fā)布:2007-07-28 11:48    編輯:泛普軟件 · xiaona    [打印此頁]    [關閉]
相關文章:

泛普項目管理系統(tǒng)其他應用

項目管理工具 禪道項目管理軟件 夢龍項目管理軟件 微軟項目管理軟件 裝飾管理系統(tǒng) 裝修預算軟件 項目計劃軟件 項目進度管理軟件 軟件項目管理工具 材料管理軟件 工程項目管理軟件系統(tǒng) 項目管理系統(tǒng) 施工管理軟件 建筑工程項目管理軟件 工程管理軟件