まずは蝋の翼から。

学んだことを書きながら確認・整理するためのメモブログ。こういうことなのかな?といったことをふわっと書いたりしていますが、理解が浅いゆえに的はずれなことも多々あると思うのでツッコミ歓迎

分位点回帰の使い方

分位点回帰(Quantile Regression)について。

OLSと比較した分位点回帰の特徴

OLSは条件付き期待値を推定する手法。

QRは条件付き分位点を推定する手法。任意の分位点なので、例えば50%分位点を指定することは、条件付き中央値を推定することになる。

外れ値に頑強

平均値の場合、外れ値があると平均値はその値にひっぱられるが中央値の場合は影響が少ない。

打ち切りや切断を無視できる

打ち切りや切断がある場合、インパクトを過大に評価する。 なお、打ち切りや切断がある際はトービットモデルを用いる。

knknkn.hatenablog.com

誤差項の分布に仮定が必要ない

OLSでは分布に正規分布を仮定している。そのため、年収など偏りが大きい分布には使えない。

各分位点に対するインパクトを、個別に求めることができる

社会学系で、格差の分析によく使われるらしい。例えば、「年収が低い層(例えば0.25%)では説明変数のインパクトはこれくらいだけど、年収が高い層ではこれくらいだよ」「年収が0~0.75分位点ではだいたい同じような正のインパクトだけど、高所得ではがらっと変わり負のインパクトになるよ」とかそういうことがわかる、という文脈。

日本語だとこのあたりの論文が良さげ

社会心理学データに対する分位点回帰分析の適用 : ネットワーク・サイズを例として

それと、以下の本にも説明があるらしい。