Link

1. 確率

確率とは「ランダムネス(不確実性)の傾向を数学的に記述するもの」であり,統計的推測とは「確率を観測データから推測し知的な確率モデルを構築すること」です.

つまり,統計学は「不確実性を科学するために基本となる数学的な道具を提供」します.


1.1 事象と確率

曖昧な定義

以下の概念を導入する.

  • 試行(Trial):実験・観測・調査などの不確かさを伴う行為
  • 事象(Event) \(A\):起こりうる試行結果の集まり.
  • 全事象/標本空間(All events/Sample space) \(\Omega\):起こりうる事象の集まり

確率\(P(A)\)は,事象\(A\)を区間\([0,1]\)に対応させる関数である.


img

測度論による定義

「確率\(P(A)\)は,事象\(A\) を区間\([0,1]\)に対応させる関数である.」


Q. では事象\(A\)とは何か?(事象\(A\)の数学的な性質は?)

A. 事象\(A\)は可測集合(つまり,可測集合であれば確率\(P(\cdot)\)を考えることができる)


  • 可測集合(Measurable set) \(A\)
    • 定義:可測集合族 \(\mathcal{B}\) の元
  • 可測集合族(Measurable family) \(\mathcal{B}\)
    • 定義:以下を満たす集合.
      • \(\emptyset \in \mathcal{B}, ~ \Omega \in \mathcal{B}\).
      • \(A \in \mathcal{B} \Rightarrow \overline{A} \in \mathcal{B}\).
      • \(A_k \in \mathcal{B}, ~ (k=1,2,\dots) \Rightarrow \cup_{k=1}^{\infty} A_k \in \mathcal{B}\).


よって,確率\(P(\cdot)\)の測度論による定義は以下のようになる.

※ 確率\(P(\cdot)\)とは,測度\(M(\cdot)\)を正規化(=スケールを[0,1]に揃える)したもの.


  • 確率(probability) \(P(\cdot)\)
    • 定義:可測集合\(A\)に対する関数\(P(\cdot)\)で,以下を満たすもの.
      • \(\forall A \in \mathcal{B}, ~ P(A) \gt 0\).
      • \(P(\Omega) = 1\).
      • 互いに排反な集合\(A_k \in \mathcal{B}, ~ (k=1,2,\dots)\) に対して,\(P(\cup_{k=1}^{\infty} A_k) = \sum_{k=1}^{\infty} P(A_k)\) が成り立つ.


1.2 条件つき確率と独立

独立の定義

以下が成り立つとき,「事象\(A\)と事象\(B\)は独立である」という.

\[P(A, B) = P(A)P(B)\]


条件付き確率の定義

2つの事象\(A, B\)に対して,

\[P(A \vert B) = \frac{P(A, B)}{P(B)}\]

を「\(B\)を与えたときの\(A\)の条件つき確率(conditional probability)」という.


全確率の公式(Law of total probability)

互いに排反な事象\(B_1, B_2, \dots, B_n\)に対して,事象\(A\)の確率は以下のように分解できる.

\[P(A) = \sum_{k=1}^{n} P(A \vert B_k)P(B_k)\]


ベイズの定理(Bayes rule)

互いに排反な事象\(B_1, B_2, \dots, B_n\)に用いると,条件付き確率\(P(B_j \vert A)\)は以下のように分解できる.

\[P(B_j \vert A) = \frac{P(A \vert B_j)P(B_j)}{ \sum_{k=1}^{n} P(A \vert B_k)P(B_k)}\]


[演習問題]

ある病気について疾患の有無を調べる簡易的な検査方法がある.この方法によると,疾患がないのに陽性反応が出てしまう確率は20%であり,一方疾患があるのに陰性となる確率は10%である.その病気にかかっているのは全体の10%であるとする.このとき,ある患者に陽性反応が出たとき,その患者が病気にかかっている確率をBayesの定理を使って求めよ.