[toc]
一揍拆、分位數(shù)回歸概念
分位數(shù)回歸是估計一組回歸變量X與被解釋變量Y的分位數(shù)之間線性關(guān)系的建模方法。
以往的回歸模型實際上是研究被解釋變量的條件期望衅枫。而人們也關(guān)心解釋變量與被解釋變量分布的中位數(shù)趣兄,分位數(shù)呈何種關(guān)系木羹。它最早由Koenker和Bassett(1978)提出致开。
OLS回歸估計量的計算是基于最小化殘差平方峰锁。分位數(shù)回歸估計量的計算也是基于一種非對稱形式的絕對值殘差最小化。其中双戳,中位數(shù)回歸運用的是最小絕對值離差估計(LAD祖今,least absolute deviations estimator)。
分位數(shù)回歸的優(yōu)點
(1)能夠更加全面的描述被解釋變量條件分布的全貌拣技,而不是僅僅分析被解釋變量的條件期望(均值),也可以分析解釋變量如何影響被解釋變量的中位數(shù)耍目、分位數(shù)等膏斤。不同分位數(shù)下的回歸系數(shù)估計量常常不同,即解釋變量對不同水平被解釋變量的影響不同邪驮。
(2)中位數(shù)回歸的估計方法與最小二乘法相比莫辨,估計結(jié)果對離群值則表現(xiàn)的更加穩(wěn)健,而且毅访,分位數(shù)回歸對誤差項并不要求很強的假設(shè)條件沮榜,因此對于非正態(tài)分布而言,分位數(shù)回歸系數(shù)估計量則更加穩(wěn)健喻粹。
二蟆融、相關(guān)推導
2.1 分位數(shù)概念
一個連續(xù)隨機變量,其總體第
分位數(shù)是
的定義是:
小于等于
的概率是
守呜,即
2.2 離差絕對值LAD
定理:連續(xù)變量用表示型酥,其概率密度函數(shù)用
表示,累計概率密度函數(shù)用
表示查乒,
的中位數(shù)用
表示弥喉,則
與任一值
的離差絕對值的期望
以
時為最小。
證明:
上文玛迄,萊布尼茨公式:
這里由境,我是用了參變量積分求導才理解通。
另有其他角度的證明蓖议,從樣本出發(fā)虏杰,直覺上感覺也沒有太大問題讥蟆,方便理解。
2.3 分位數(shù)回歸
目標函數(shù)(15.3)不可微嘹屯,因此傳統(tǒng)的對目標函數(shù)求導的方法不再適用攻询。
2.4 效果以及理解
以一元 回歸為例,如果用 LAD 法估計的中位數(shù)回歸直線與用 OLS 法估計的均值回歸直線有顯著差別州弟, 則表明被解釋變量 y 的分布是非對稱的钧栖。如果散點圖上側(cè)分位數(shù)回歸直線之間與下側(cè)分位數(shù)回歸 直線之間相比,相互比較接近婆翔,則說明被解釋變量 y 的分布是左偏倚的拯杠。反之是右偏倚的。對于 不同分位數(shù)回歸函數(shù)如果回歸系數(shù)的差異很大啃奴,說明在不同分位數(shù)上解釋變量對被解釋變量的影 響是不同的潭陪。
三、模型檢驗
1最蕾、擬合優(yōu)度(Goodness-of-Fit)
2依溯、擬似然比檢驗(Quasi-Likelihood Ratio Tests)
3、Wald 檢驗
系列分位數(shù)回歸檢驗
1)斜率相等檢驗
2)對稱性檢驗
略
四瘟则、求解方法
點估計:
區(qū)間估計:
R : quantreg - rq()
相關(guān):
https://www.cnblogs.com/shangfr/p/5736738.html
statsmodels參考文獻:
Roger Koenker and Kevin F. Hallock. "Quantile Regressioin". Journal of Economic Perspectives, Volume 15, Number 4, Fall 2001, Pages 143–156黎炉。