E資格 数学編 分類のアルゴリズム!?
正直なんで確率がこんなところで出てくるのかわからなかったのですが、迷惑メールの仕分けなどにナイーブベイズと呼ばれるものが使われていて、そのナイーブベイズというものが確率を用いられているそうです。
ナイーブベイズとはという話をするために、ベイズの定理を理解する必要があります。
ベイズの定理とは、
結果の確率(事前確率、データからわかる)
P(A), P(B), P(B|A)がわかっていれば、その結果となった原因の確率(事後確率)
P(A|B) がわかるということです。
※尤度とは統計学において、ある前提条件に従って結果が出現する場合に、逆に観察結果からみて前提条件が「何々であった」と推測する尤もらしさ(もっともらしさ)を表す数値を、「何々」を変数とする関数として捉えたものである。(wikipedia引用)
例えば、ある街で、火事が起こる確率がP(Fire)=0.01P(Fire)=0.01 で、煙が上がっているのを見る確率がP(Smoke)=0.1P(Smoke)=0.1 だとします。また火事の90%で煙が上るとすると、(P(Smoke|Fire)=0.9)(P(Smoke|Fire)=0.9) 煙が見えたときに実際にそれが火事が原因である事後確率は、ベイズの定理より正しい推定確率が計算できるのです。
下記のサイトがわかりやすかったため説明に引用させていただきました。
(https://avinton.com/academy/naive-bayes/)
これを見た時、機械学習でやった分類モデルを思い出しました。(最初習った時は軽くスルーしていて、今になって衝撃を受けました(´>∀<`)ゝ)
そしてナイーブベイズとは
データが与えられたときの全ての推定の確率を計算し、最も確率の高いものを推定結果として出力するアルゴリズムだそうです!
もっと詳しく知りたい方は下記の記事がおすすめです だいぶ古いものですが( ˊᵕˋ ;)💦
(https://qiita.com/aflc/items/13fe52243c35d3b678b0)
まさか確率でここまで来るとは思わなかったです( ˊᵕˋ ;)💦 数学の奥深さとすごさを実感した日になりました。