まずは蝋の翼から。

学んだことを書きながら確認・整理するためのメモブログ。こういうことなのかな？といったことをふわっと書いたりしていますが、理解が浅いゆえに的はずれなことも多々あると思うのでツッコミ歓迎

Beta分布のパラメータ

統計書籍

いつも以上に、自分用の備忘録的な書き方になります。

Beta分布はパラメータA,Bを持ち、Beta(A,B)として関数形が変わる。
では、パラメータA, Bの事前分布はどう求めたらいいだろうか？

1つはテキトーに無情報分布として置く方法。もう1つはある程度想定される平均、集中度(分散と似たもの）の情報を置いて階層ベイズをおこなう方法がある。

後者についてだが、Beta分布の平均は $μ = \frac{A}{A + B}$ 、集中度は $φ = A + B$ となる(φでなく、κと置いている文献もある）。このことから、平均 $μ$ 、集中度を $φ$ とすると、 $A = μφ$ 、 $B = φ(1-μ)$ と置き換えることができる。

また、想定したいBeta分布が歪んだ分布(最頻値≠平均値)なときは、平均値ではなく最頻値で考えたいと思う。その場合は、(A, B > 1のとき)最頻値 $ω = \frac{A - 1}{A + B - 2}$ 、集中度は $φ = A + B$ となる。
このときは、 $A = ω(φ - 2) + 1$ 、 $B = (1 - ω)(μ - 2) + 1$ となる。

以上から、Beta分布について想定される集中度 $φ$ と、平均 $μ$ あるいは最頻値 $ω$ に基づいて仮定を置いた階層ベイズをおこなうことができる。

例えば、想定される平均 $μ$ が大体0.3くらいの正数ならば、平均 $μ$ は平均0.3のBeta分布から生成されるとして $μ 〜 Beta(A', B')$ とし、このBeta分布は実際の値をプロットした確率分布系と似た形となるようにA',B'を調整する。具体的には、 $μ' = \frac{A'}{A' + B'} = 0.3$ となる組み合わせに対して、色々と試す。なお、 $φ' = A' + B'$ から、A',B'のスケールを大きくすると仮定が強くなる(平均に集中した裾野の短い分布となる）。

$φ$ はテキトーに無情報分布なり、半コーシー分布なりを置く(※分散の事前分布については下記参照）。

階層モデルの分散パラメータの事前分布について from hoxo_m

www.slideshare.net

ちなみに下記の本を参照しました。

ベイズ統計モデリング: R,JAGS, Stanによるチュートリアル原著第2版

ベイズ統計モデリング: R,JAGS, Stanによるチュートリアル原著第2版

作者: John K. Kruschke,前田和寛,小杉考司
出版社/メーカー: 共立出版
発売日: 2017/07/22
メディア: 大型本
この商品を含むブログ (2件) を見る