まずは蝋の翼から。

学んだことを書きながら確認・整理するためのメモブログ。こういうことなのかな?といったことをふわっと書いたりしていますが、理解が浅いゆえに的はずれなことも多々あると思うのでツッコミ歓迎

Beta分布のパラメータ

いつも以上に、自分用の備忘録的な書き方になります。

Beta分布はパラメータA,Bを持ち、Beta(A,B)として関数形が変わる。
では、パラメータA, Bの事前分布はどう求めたらいいだろうか?

1つはテキトーに無情報分布として置く方法。もう1つはある程度想定される平均、集中度(分散と似たもの)の情報を置いて階層ベイズをおこなう方法がある。

後者についてだが、Beta分布の平均はμ = \frac{A}{A + B}、集中度はφ = A + Bとなる(φでなく、κと置いている文献もある)。 このことから、平均μ、集中度をφとすると、A = μφB = φ(1-μ)と置き換えることができる。

また、想定したいBeta分布が歪んだ分布(最頻値≠平均値)なときは、平均値ではなく最頻値で考えたいと思う。その場合は、(A, B > 1のとき)最頻値ω = \frac{A - 1}{A + B - 2}、集中度はφ = A + Bとなる。
このときは、A = ω(φ - 2) + 1B = (1 - ω)(μ - 2) + 1となる。

以上から、Beta分布について想定される集中度φと、平均μ あるいは 最頻値ωに基づいて仮定を置いた階層ベイズをおこなうことができる。

例えば、想定される平均μが大体0.3くらいの正数ならば、平均μは平均0.3のBeta分布から生成されるとしてμ 〜 Beta(A', B')とし、このBeta分布は実際の値をプロットした確率分布系と似た形となるようにA',B'を調整する。具体的には、μ' = \frac{A'}{A' + B'} = 0.3となる組み合わせに対して、色々と試す。なお、 φ' = A' + B'から、A',B'のスケールを大きくすると仮定が強くなる(平均に集中した裾野の短い分布となる)。

φはテキトーに無情報分布なり、半コーシー分布なりを置く(※分散の事前分布については下記参照)。

www.slideshare.net

ちなみに下記の本を参照しました。

ベイズ統計モデリング: R,JAGS, Stanによるチュートリアル 原著第2版

ベイズ統計モデリング: R,JAGS, Stanによるチュートリアル 原著第2版