<sup id="ai8i2"><center id="ai8i2"></center></sup>
<rt id="ai8i2"><small id="ai8i2"></small></rt>

程序員的數學--用貝葉斯定理來推斷一個案子

貝葉斯講什么呢?

先拋出一個問題:

我有一個同事年不群,請問他是正人君子的可能性有多大?

因為可能性是個主觀感受,沒有辦法量化,所以在數學中一般會問年不群是正人君子的概率有多高?

初看無從下手,但其實也有套路可循。

  1. 先給一個假設
  2. 然后觀察驗證和修改
  3. 得到相對靠譜的結果

比如,我們具體可以先這樣做:

  1. 假設他是正人君子的概率是 0.5
  2. 尋求證據,證明他是正人君子或者否
  3. 修正之前的假設概率得到最終概率

你看看,這實際和我們的日常生活也差不多,貝葉斯定理正好可以解決如此問題,不過它是數學工具。

什么是貝葉斯定理?

因為是數學工具,它有自己的公式:
P ( H ∣ E ) = P ( H ) ? P ( E ∣ H ) / P ( E ) P(H|E)=P(H)*P(E|H)/P(E) P(HE)=P(H)?P(EH)/P(E)

我歸納如下:

貝葉斯定理是一個通過修正先驗概率最終求得后驗概率的過程。

先驗概率

上面公式中的 P(H) 是先驗概率。

先驗概率一般指事先統計、經驗估算的概率,它是一個既成的事實,不以人的意志為轉移。

條件概率

P(E|H) 是條件概率,當事件 H 發生時,事件 E 也發生的概率是多少

標準似然度 1

P ( E ∣ H ) / P ( E ) P(E|H)/P(E) P(EH)/P(E)

后驗概率

P(H|E) 是條件概率,但因為標準似然度的原因,它被稱為后驗概率。
P ( 后 驗 ) = 標 準 似 然 度 ? P ( 先 驗 ) P(后驗)=標準似然度*P(先驗) P()=?P)

貝葉斯推理嘗試

好了,公式知道了,我們來求年不群是不是正人君子的概率。

1. 給假設概率

假定一個人是正人君子的概率是 0.6,我們用 P(H) 表示,H 是假設(Hyposesis) 的縮寫
P ( H ) = 0.6 P(H) = 0.6 P(H)=0.6
比如 100 個人當中有 60 個正人君子,40 個猥瑣男。

2. 觀察論證

我一直以為你是正人君子,直到。。。

這個句式是比較常見的電視劇臺詞模板,說明了什么呢?

一些新的線索,讓之前的看法發生了改變。

比如:

  1. 我一直以為你是正人君子,直到發現你最終經常做一些猥瑣的動作。
  2. 我一直以為你是正人君子,直到發現你每天讀《曾國潘家書》。

兩種不同的證據,會改變假設的可能性,可能增強,可能減弱。

設想,我們發現的第一類證據,看見了年不群做一些猥瑣的動作。

猥瑣男不一定做猥瑣的動作,做猥瑣動作的也可能是正人君子。

怎么把這個現象用數學概率描述出來呢?

猥瑣動作記為事件 E,它其實也有概率,用 P(E) 指代,E 是 Evidence 的縮寫。
P ( E ) = P ( E ∣ H ) ? P ( H ) + P ( E ∣ A ) ? P ( A ) P(E) = P(E|H)*P(H) + P(E|A)*P(A) P(E)=P(EH)?P(H)+P(EA)?PA
這里的 A 代表猥瑣男,P(A) 是猥瑣男的概率。

P(E) 的意義是一個人做猥瑣動作的概率,包括了正人君子做猥瑣動作的概率和猥瑣男做猥瑣動作的概率。

假設 60 個正人君子中有 5 個人做了猥瑣的動作,那么按照統計學的算法
P ( E ∣ H ) = 5 / 60 = 0.083 P(E|H)=5/60=0.083 P(EH)=5/60=0.083
假設 40 個猥瑣男中有 36 個人會做猥瑣的動作,那么概率是:
P ( E ∣ A ) = 36 / 40 = 0.9 P(E|A)=36/40=0.9 P(EA)=36/40=0.9
那么,整體人群做猥瑣動作的比例就可以根據公式求出來了:
P ( E ) = P ( E ∣ H ) ? P ( H ) + P ( E ∣ A ) ? P ( A ) = 0.083 ? 0.6 + 0.9 ? 0.4 = 0.05 + 0.36 = 0.41 P(E) = P(E|H)*P(H) + P(E|A)*P(A)=0.083*0.6+0.9*0.4=0.05+0.36=0.41 P(E)=P(EH)?P(H)+P(EA)?PA=0.083?0.6+0.9?0.4=0.05+0.36=0.41
這樣,套公式后驗概率也可以求出來了:
P ( H ∣ E ) = P ( H ) ? P ( E ∣ H ) / P ( E ) = 0.6 ? 0.083 / 0.41 = 0.12 P(H|E)=P(H)*P(E|H)/P(E)=0.6*0.083/0.41=0.12 P(HE)=P(H)?P(EH)/P(E)=0.6?0.083/0.41=0.12
這代表什么呢?

代表年不群是正人君子的概率是 12%.

但如果不考慮證據的前提下,他的先驗概率可是高達 60%。

數學題目練習

一個幼兒園的男孩、女孩的比例是 4.5 :5.5,男孩子往水池扔東西的概率是 0.6,女孩子扔東西的概率是 0.4?,F在發現水池有一個玩具,請問是男孩子扔的概率是多少?

A 代表男孩子,所以 P(A) 為 0.45

B 代表女孩子,所以P(B) 為 0.55

E 代表扔東西,P(E|A) = 0.6,P(E|B)=0.4,所以:
P ( E ) = P ( E ∣ A ) ? P ( A ) + P ( E ∣ B ) ? P ( B ) = 0.6 ? 0.45 + 0.4 ? 0.55 = 0.49 P(E)=P(E|A)*P(A)+P(E|B)*P(B)=0.6*0.45+0.4*0.55= 0.49 P(E)=P(EA)?P(A)+P(EB)?P(B)=0.6?0.45+0.4?0.55=0.49
那么套用貝葉斯公式
P ( A ∣ E ) = P ( A ) ? P ( E ∣ A ) / P ( E ) = 0.45 ? 0.6 / 0.49 = 0.55 P(A|E)=P(A)*P(E|A)/P(E)=0.45*0.6/0.49=0.55 P(AE)=P(A)?P(EA)/P(E)=0.45?0.6/0.49=0.55
男孩子的概率也只是 55%,看起來,男孩子淘氣,但是女孩子數量多且扔東西的比例也不低,所以,不能隨便冤枉人。

貝葉斯定理的影響因子

回到貝葉斯定理的公式:
P ( H ∣ E ) = P ( H ) ? P ( E ∣ H ) / P ( E ) P(H|E)=P(H)*P(E|H)/P(E) P(HE)=P(H)?P(EH)/P(E)

P ( E ) = P ( E ∣ H ) ? P ( H ) + P ( E ∣ A ) ? P ( A ) P(E) = P(E|H)*P(H) + P(E|A)*P(A) P(E)=P(EH)?P(H)+P(EA)?PA

能夠影響最終結果的有 4 項:

  1. P(H)
  2. P(A)
  3. P(E|H)
  4. P(E|A)

先驗的重要性

先驗如果不是經過嚴密的統計數據那么就和拍腦袋一樣,或者說本身就是拍腦袋,如果證據很少或者是難以發現,最終的結果就很難保證公平。

比如,發生案子的時候,你鎖定了一個嫌疑犯,如果沒有找到關鍵證據,你能輕易給定論嗎?

證據的重要性

證據和假設正相關,代表標準似然度 > 1,它能夠增強假設。

證據和假設負相關,代表標準似然度 < 1,它會減弱假設。

證據和假設毫無關系,代表標準似然度 = 1,它對結果毫無意義。

所以,證據也同樣需要嚴謹對待。

貝葉斯定理的意義

貝葉斯定理應用很廣,任何需要預測估計的地方,幾乎都可以應用。就我實際接觸過的有機器學習和自動駕駛。

貝葉斯也有很現實的生活哲學意義。

大數據時代,你在網絡上看到的故事可能不是事實,可能它是假的。一個事實也可能不是數據,因為它可能是孤立的不具代表性,數據可能不是證據,它可能是片面的,只是別人刻意讓你看見的。2

你很可能被你的直覺或者表面現象欺騙。

參考


  1. 王麗. 淺析貝葉斯公式及其在概率推理中的應用[J]. 科技創新導報,2010,(24):136 ??

  2. Alex Edmans.What to trust in a post-truth world.https://www.ted.com ??

frank909 CSDN認證博客專家 CV(computer?vision)
愛閱讀的程序員,專注于技術思考和分享。關注架構設計、Android 開發、AI、數學、自動駕駛領域,個人公號:Frankcall
??2020 CSDN 皮膚主題: 編程工作室 設計師:CSDN官方博客 返回首頁
實付 19.90元
使用余額支付
點擊重新獲取
掃碼支付
錢包余額 0

抵扣說明:

1.余額是錢包充值的虛擬貨幣,按照1:1的比例進行支付金額的抵扣。
2.余額無法直接購買下載,可以購買VIP、C幣套餐、付費專欄及課程。

余額充值
彩61彩票