統計検定1級への道 その7
進捗
勉強開始約1ヶ月、60%完了。
前回からは、レイリー分布、負の二項分布を勉強。
レイリー分布
レイリー分布は電波強度などが従う分布
確率密度関数の導出、積分して1になることの確認、期待値、分散の導出までOK
基本的に正規分布のときと同じ処理で全部計算できる。
試験範囲外なので一旦完了とする。
負の二項分布
定義が2通り(厳密には同じだけど考え方として)あるのでややこしい。
https://stats.biopapyrus.jp/probability/negative-binomial.html
がわかりやすい
結局k回目成功するまでの試行回数の分布と捉えるか、失敗回数の分布と捉えるかの違い。上記の例だと試行回数xと、成功回数k+失敗回数yの和が同じなので変換すれば等価になる。
応用について考えてみる。
特定の発生回数までの全体の分布、y回成功するまでの失敗回数の分布って何に使えるのか??
http://lis.mslis.jp/pdf/LIS027055.pdf
図書の貸し出し頻度をモデル化→図書館の運営に利用(人員配置や業務量の予測に使う)
こういう話は確率分布の一般的な応用としてありそう、なにかの事象をモデル化してコストや人員の予測に使う。業務運営上の利用。すごく価値があるかと言われると微妙。結局モデル化誤差が乗るし、対象が一定なら最初は多めに予想して実情を見て減らせばいいから確率分布を用いることによる金額的なメリットがとても大きいというのはレアケースな気がする。
https://www.slideshare.net/simizu706/ss-50994149
・一定の割合の対象を所望の人数集めるために何人集めればよいか、95%の確率で達成できる人数を推定できる。
・ポアソン分布の過分散推定
https://qiita.com/qiita_kuru/items/d9782185652351c78aac
マーケティング分野で消費者行動予測
期待値、分散などの導出について
2つの考え方について、導出してみているが、失敗回数の確率分布とした場合について難航している。
試行回数の確率分布とした場合は、各成功が幾何分布に従うこと、期待値の線形性からかなり簡単に導出できる。
失敗回数の確率分布とした場合はモーメント母関数を使えば簡単に導出できるが、モーメント母関数の導出で躓く。期待値の定義通りの導出ではうまく変数を展開して総和が1になるようにくくって導出する方法だと思うが今日はここまで行かなかった。
多分下記のリンクの例1.14の形が楽だと思う。
http://www.math.kobe-u.ac.jp/HOME/higuchi/h24kogi/12prob1-4.pdf
勉強していた感じ二項定理、多項定理や級数の扱いが苦手なことがわかってきたのでこのあたり復習したい。
項目と進捗まとめ (1周目 2週目 3周目)
- 正規分布の基礎的なこと 4/14-15
- 正規分布の標準化の意味と証明 4/15-16
- 一様分布の平均,分散,特性関数など 4/16-17
- ポアソン分布の意味と平均・分散 4/20-22
- 多変量正規分布の確率密度関数の解説 4/21-22
- 指数分布の意味と具体例 4/21-27
- モーメント母関数の意味と具体的な計算例 4/24-27
- 最大値と最小値の分布(一般論と例)4/27-29
- ベータ分布の意味と平均・分散の導出 4/29-5/1
- 多項分布の意味と平均,分散,共分散などの計算 4/30-5/3
- コーシー分布とその期待値などについて 5/2-5
- ディリクレ分布の意味と正規化,平均などの計算 5/3-9
- 対数正規分布の例と平均,分散 5/5-9
- フォンミーゼスフィッシャー分布 5/8-9
- レイリー分布の期待値,分散,正規分布との関係
- 負の二項分布の意味と期待値,分散
- ガンマ分布の意味と期待値,分散
- 歪度,尖度の定義と意味
- ベイズ推定の簡単な例と利点
- マルコフの不等式とその証明
- モンテカルロ法と円周率の近似計算
- 待ち行列理論(M/M/1モデル)の定理とその証明
- 確率空間の定義と具体例(サイコロ,コイン)
- 条件付き期待値,分散の意味と有名公式
- 指数型分布族の定義と例
感覚としては1週目と2,3週目が同じくらいの時間がかかるので、1周目を1、2,3周目を0.5とする。ただ全部を必ずというわけではなく90%くらいできたら次に行く感じですすめる。
(15*1)+(15*0.5)+(15*0.5)= 30 → 30/50(60%)