I Like Bayesian World


Wako.R で発表しました。つたない説明だったので,補足説明をします。ちなみに "I Like" とは "Intractable Likelihood" の頭文字です。元ネタはスライドの参考文献に。

スライド

補足説明

ABC ついての説明を加えます。 ABC のポイントは,変更することができない観察データ をシミュレーションデータ という自由度が高い世界に持ち込むことです。 24 ページの

というのはまさに,扱いが困難な尤度 を,シミュレーション可能な という形に置き換えています。 のとき,この式は

で,元の比例式

の有無を除けばそっくりです。比例の世界でなくなっても良いものは定数だということを考えれば,「 で定数」という条件は, で真の事後分布と一致することを意味します。そして, 以外の場所では より密度が低くなるけれど, のときに密度が比較的高くなるというのは,近似の誤差の部分を表現していることになります。

統計量を使って近似する場合は注意が必要で,統計量はデータに対して十分な情報を持っていれば正しく近似されますが,不適切な統計量を利用すると著しく近似精度が悪くなります[A]。その分野でよく研究された統計量は利用する価値があるでしょう。

ABC の一番のメリットは,扱いが困難な尤度が計算不要であることです。すなわち,尤度を解析的でなく計算機パワーで解決できるので[B],計算上の都合で不適切なモデルを仮定する必要がないということです。指数型分布族や共役事前分布といった天下り的な確率分布にとらわれることなく,自由な統計モデリングが可能になります。

脚注

  1. 例に挙げた文字列の統計量は現実的に利用されるべきでないものです。さまざまなバックグラウンドを持つ人が集まる場で通じる良い例が思い浮かばなかったのです。 []
  2. 今回の Wako.R はスパコン見学会があったため,計算機の力で解決できる世界の話をしたかったのです。 []