確率について説明します。
事象
結果が偶然に支配されている実験を試行と定義します。
試行の結果のそれぞれを根元事象と定義します。
「トランプから1枚選ぶこと」が試行で、「ハートのA」や「スペードの1」が根元事象、です。
下記が根元事象です。
- さいころの目が1
- さいころの目が2
- さいころの目が3
- さいころの目が4
- さいころの目が5
- さいころの目が6
根元事象をまとめたものを事象と定義します。
根元事象の部分集合を事象と定義します。
「ハートの全体」、「スペードとダイヤの全体」は「トランプから1枚選ぶ」試行における事象です。
下記が事象です。
- さいころの目が1
- さいころの目が2
- さいころの目が3
- さいころの目が4
- さいころの目が5
- さいころの目が6
- さいころの目が2の倍数
- さいころの目が3の倍数
- さいころの目が2以上
- さいころの目が3以上
- さいころの目が1または2
空事象として下記も事象とできるはずだけど、見たことないな。
- さいころの目が7
さいころの目が1とさいころの目が2は互いに排反です。
確率事象
試行を行うときに、根元事象に対して関心の向けている内容を、指標と定義します。
スペード、ハート、クローバー、ダイヤ、は記号に対する指標で、赤いカードは色に対する指標です。
試行の指標だけと関連した概念で言い表すことができるような事象を、その試行のその指標に対する確率事象と定義します。
記号を指標としているとき、1の全体とか2の全体とかは確率事象でない、ということです。
確率変数
同じ確率事象に属する根元事象には、同じ値が与えられている。
違う確率事象に属する根元事象には、互いに違う値が与えられている。
上記を満たすとき、全事象\( \Omega \)の上の確率変数と定義します。
具体例を示します。
根元事象を\(a\)とします。
確率変数を\( \mathrm{X} \)とします。
\[
\mathrm{X}(a)
=
\begin{cases}
1 \ (a : \spadesuit) \\
2 \ (a : \heartsuit) \\
3 \ (a : \clubsuit) \\
4 \ (a : \diamondsuit)
\end{cases}
\]
\( \mathrm{X} \)は\( \Omega \)の上の1つの確率変数となります。
1,2,3,4は自分で決めた\(a\)における\(X\)の値です。
どうとでも値を決めることが出来ますが、実際は\(X\)が\(f(x)\)に従うときの正規分布などを考えて使います。
値の決め方によって、いくらでも確率変数を作ることができます。ですが、無駄に意味のない確率変数を量産することはないと思います。
離散型の実確率分布
離散型の実確率分布の例として、理想的なさいころの実確率分布を図示すると、下記となります。
2を1にして、4を3にしたさいころを考えます。このときのさいころの実確率分布を図示すると、下記となります。
連続型の実確率分布
連続型の実確率分布の例として、標準正規分布の図を下記に示します。
標準正規分布は、\((平均)=0\)、\((分散)=1\)のときの正規分布です。下記の関数で表すことができます。
$$
f(x) = \frac{1}{\sqrt{2 \pi}} e^{-\tfrac{x^2}{2}}
$$
確率密度関数 / Probability Density Function
連続型確率変数\( \mathrm{X} \)が、連続型の実確率分布を関数\( f(x) \)で表すことができるとき、\( f(x) \)を\( \mathrm{X} \)の確率密度関数と定義します。
確率を確率密度関数の面積で表します。確率密度関数は下記を満たさなければなりません。
\[
\begin{gather}
\int_{- \infty}^{\infty} f(x) dx = 1 \\[5pt]
f(x) \geqq 0
\end{gather}
\]
確率密度
連続型の実確率分布を表す確率密度関数\( f(x) \)について\( x \)をある値\( x_0 \)にしたときの\( f(x_0) \)の値が確率密度です。
同時確率密度関数
連続型確率変数\( \mathrm{X} \)と\( \mathrm{Y} \)が、連続型の実確率分布を関数\( f_{X,Y}(x, y) \)で表すことができるとき、\( f_{X,Y}(x, y) \)を\( \mathrm{X} \)と\( \mathrm{Y} \)の同時確率密度関数と定義します。
文献により、\( f_{X,Y}(x, y) \)、\( f_{XY}(x, y) \)、\( f^{X,Y}(x, y) \)、\( f(x, y) \)と表されます。
二変数関数なので、図示すると曲面になります。
同時確率密度関数は下記を満たさなければなりません。
\[
\begin{gather}
\int_{- \infty}^{\infty} \int_{- \infty}^{\infty} f(x, y) dxdy = 1 \\[5pt]
f(x, y) \geqq 0
\end{gather}
\]
周辺確率密度関数
\( f(x, y) \)が同時確率密度関数とします。このとき、下記の2つの関数を周辺確率密度関数と定義します。
\[
\begin{align*}
f_{X}(x) = \int_{- \infty}^{\infty} f_{X,Y}(x,y) dy \\[8pt]
f_{Y}(y) = \int_{- \infty}^{\infty} f_{X,Y}(x,y) dx
\end{align*}
\]
条件付き確率密度関数 / Conditional Probability Density Function
連続型確率変数\( \mathrm{X} \)と\( \mathrm{Y} \)が連続型の実確率分布を関数\( f(x, y) \)で表すことができるとき、下記の2つの関数を条件付き確率密度関数と定義します。
\[
\begin{align*}
f_{Y \vert X}(y) = \frac{ f_{X,Y}(x,y) }{ f_{X}(x) } \\[8pt]
f_{X \vert Y}(x) = \frac{ f_{X,Y}(x,y) }{ f_{Y}(y) }
\end{align*}
\]
条件付き確率
\(A\)と\(B\)が確率事象であるとき、下記を条件付き確率と定義します。
$$
\frac{p(A \cap B)}{p(A)}
$$
これを\( p(B \vert A) \)と書きます。\(A\)が起こった後に\(B\)が起こる確率を示します。
定義から、下記の2つの式を得ます。
$$
p(B \vert A) = \frac{p(A \cap B)}{p(A)}
$$
$$
p(A \vert B) = \frac{p(A \cap B)}{p(B)}
$$
2つの式から下記を得ます。
$$
p(A \cap B) = p(B \vert A)p(A) = p(A \vert B)p(B)
$$
ベイズの定理
上記から下記の変形をします。
$$
p(B \vert A) = \frac{p(A \cap B)}{p(A)} = \frac{p(A \vert B)p(B)}{p(A)}
$$
ここで、族\( \{ B_1, B_2, B_3, \cdots, B_n \} \)が全事象\(\Omega\)の分割であるとします。かつ、\(0 \lt p(B_i)\)とします。
分割なので、\( p(A) = \displaystyle \sum_{i=1}^n p(A \cap B_i)\)が成立します。
$$
p(B_i \vert A) = \frac{p(A \cap B_i)}{p(A)} = \frac{p(A \vert B_i)p(B_i)}{p(A)} = \frac{p(A \vert B_i)p(B_i)}{\displaystyle \sum_{i=1}^n p(A \cap B_i)} = \frac{p(A \vert B_i)p(B_i)}{\displaystyle \sum_{i=1}^n p(A \vert B_i)p(B_i)}
$$
\(p(B_i \vert A)\)を事後確率と言います。
\(p(A \vert B_i)\)を尤度と言います。
\(p(B_i)\)を事前確率と言います。
参考
お断り
いい加減に書いています。自分で責任を取れる人の仕事の参考にと思って書いています。絶対に大学受験、高校受験の参考にはしないでください。成績を上げるためには、予備校、Z会、を利用してください。
広告
IT開発関連書とビジネス書が豊富な翔泳社の通販『SEshop』さくらのレンタルサーバ
ムームードメイン
Oisix(おいしっくす)
らでぃっしゅぼーや
珈琲きゃろっと
エプソムソルト