最近中文字幕完整版2018一页,久热最新在线观看视频

1.

本文介紹一個貝葉斯推斷的python實現(xiàn)例，并展現(xiàn)了基于標量運算的實現(xiàn)和基于numpy的矩陣運算的實現(xiàn)之間的差別。

2. 問題描述

本問題例取自于Ref1-Chapter1.

問題描述：假設有一個制作燈泡的機器。你想知道機器是正常工作還是有問題。為了得到答案你可以測試每一個燈泡，但是燈泡數(shù)量很多，每一個都測試在實際生產(chǎn)過程中可能是無法承受的。使用貝葉斯推斷，你可以基于少量樣本（比如說抽檢結果）來估計機器是否在正常地工作（in probabilistic way）。

構建貝葉斯推斷時，首先需要兩個要素:

(1) 先驗分布

(2) 似然率

先驗分布是我們關于機器工作狀態(tài)的初始信念。首先我們確定第一個刻畫機器工作狀態(tài)的隨機變量，記為M。這個隨機變量有兩個工作狀態(tài)：{working, broken}，以下簡寫成{w, br}(縮寫成br是為了與下面的Bad縮寫成b區(qū)分開來)。作為初始信念，我們相信機器是好的，是可以正常工作的，定義先驗分布如下：

P(M=working) = 0.99

P(M=broken ) = 0.01

這表明我們對于機器正常工作的信念度很高，有99%的概率能夠正常工作。

第二個隨機變量是L，表示機器生產(chǎn)的燈泡的工作狀態(tài)。燈泡可能是好，也可能是壞的，包含兩個狀態(tài)：{good, bad}，以下簡寫成{g,b}，注意br與b的區(qū)別。

我們需要基于機器工作狀態(tài)給出L的先驗分布，也就是條件概率P(L|M)，在貝葉斯公式中它代表似然概率(likelihood)。

定義這個似然概率分布（由于M和L各有兩種狀態(tài)，所以一共包含4個條件概率）如下：

P(L=Good|M=w) = 0.99

P(L=Bad |M=w) = 0.01

P(L=Good|M=br ) = 0.6

P(L=Bad |M=br ) = 0.4

以上似然概率表明，在機器正常時我們相信每生成100個燈泡只會有一個壞的，而機器不正常時也不是所有燈泡都是壞的，而是有40%會是壞的。為了實現(xiàn)的方便，可以寫成如下的矩陣形式：

現(xiàn)在，我們已經(jīng)完整地刻畫了貝葉斯模型，可以用它來做一些神奇的估計和預測的工作了。

我們的輸入是一些燈泡的抽檢結果。假設我們抽檢了十個燈泡其抽檢結果如下：

{bad, good, good, good, good, good, good, good, good, good}

讓我們來看看基于貝葉斯推斷的我們對于機器工作狀態(tài)的信念（后驗概率）如何變化。

3. 貝葉斯規(guī)則

貝葉斯推斷規(guī)則以貝葉斯公式的形式表示為：

具體映射到本問題中可以表達如下：

貝

葉斯推斷的優(yōu)先在于可以以在線（online）的方式進行，即觀測數(shù)據(jù)可以一個一個地到來，每次受到一個新的觀測數(shù)據(jù)，就進行一次基于貝葉斯公式的后驗概率的計算更新，而更新后的后驗概率又作為下一貝葉斯推斷的先驗概率使用。因此在線的貝葉斯推斷的基本處理流程如下所示：

4. Bayes engine: scalar implementation

首先，我們以標量運算的方式寫一個函數(shù)來進行bayes推斷處理。

prior以向量的形式存儲先驗概率分布，prior[0]表示P(M=working)，prior[1]表示P(M=broken)。

likelihood以矩陣的形式方式存儲似然概率分布。其中第1行表示P(L/M=working)，第2行表示P(L/M=broken).

在本例中，當輸入時，evidence的計算式（注意evidence是依賴于輸入的觀測數(shù)據(jù)的）是:

注意，當我寫P(w)其實是表示P(M=w)，而其實是表示，余者類推。根據(jù)上下文，這些應該不會導致混淆。

第一個函數(shù)的代碼如下：

def bayes_scalar(prior, likelihood, data):
 """
 Bayesian inference function example.
 Parameters
 ----------
 prior : float, 1-D vector
  prior information, P(X).
 likelihood : float 2-D matrix
  likelihood function, P(Y|X).
 data : List of strings. Value: 'Good','Bad'
  Observed data samples sequence
 Returns
 -------
 posterior : float
  P(X,Y), posterior sequence.
 """
 
 posterior = np.zeros((len(data)+1,2))
 posterior[0,:] = prior  # Not used in computation, just for the later plotting
 
 for k,L in enumerate(data):
  if L == 'good':
L_value = 0
  else:
L_value = 1
  #print(L, L_value, likelihood[:,L_value])
 
  evidence= likelihood[0,L_value] * prior[0] + likelihood[1,L_value] * prior[1]
  LL0_prior_prod= likelihood[0,L_value] * prior[0] 
  posterior[k+1,0]  = LL0_prior_prod / evidence
 
  LL1_prior_prod= likelihood[1,L_value] * prior[1]  
  posterior[k+1,1]  = LL1_prior_prod / evidence
  
  prior = posterior[k+1,:] # Using the calculated posterior at this step as the prior for the next step
 
 return posterior

5.Bayes engine: vectorization

我們注意到，evidence的計算可以表示成兩個向量的點積，如下所示。

這樣就非常方便用numpy來實現(xiàn)了。本例中每個隨機變量只有兩種取值，在復雜的情況下，每個隨機變量有很多種取值時，有效利用向量或矩陣的運算是簡潔的運算實現(xiàn)的必不可缺的要素。以上這兩個向量的點積可以用numpy.dot()來實現(xiàn)。

另外，likelihood和prior的乘積是分別針對M的兩種狀態(tài)進行計算（注意，我們需要針對M的兩種不同狀態(tài)分別計算posterior），不是用向量的點積進行計算，而是一種element-wise multiplication，可以用numpy.multiply()進行計算。所以在vectorization版本中貝葉斯更新處理削減為兩條語句，與上面的scalar版本相比顯得非常優(yōu)雅簡潔（好吧，也許這個簡單例子中還顯不出那么明顯的優(yōu)勢，但是隨著問題的復雜度的增加，這種優(yōu)勢就會越來越明顯了。）

由此我們得到向量化處理的函數(shù)如下：

def bayes_vector(prior, likelihood, data):
 """
 Bayesian inference function example.
 Parameters
 ----------
 prior : float, 1-D vector
  prior information, P(X).
 likelihood : float 2-D matrix
  likelihood function, P(Y|X).
 data : List of strings. Value: 'Good','Bad'
  Observed data samples sequence
 Returns
 -------
 posterior : float
  P(X,Y), posterior sequence.
 """
 
 posterior = np.zeros((len(data)+1,2))
 posterior[0,:] = prior  # Not used in computation, just for the later plotting
 
 for k,L in enumerate(data):
  if L == 'good':
L_value = 0
  else:
L_value = 1
  #print(L, L_value, likelihood[:,L_value])
 
  evidence = np.dot(likelihood[:,L_value], prior[:])
  posterior[k+1,:]  = np.multiply(likelihood[:,L_value],prior)/evidence
 
  prior = posterior[k+1,:] # Using the calculated posterior at this step as the prior for the next step
  
 return posterior

6. 測試

讓我們來看看利用以上函數(shù)對我們的觀測數(shù)據(jù)進行處理，后驗概率將會如何變化。

import numpy as np
import matplotlib.pyplot as plt
 
prior= np.array([0.99,0.01])
likelihood = np.array([[0.99,0.01],[0.6,0.4]])
data = ['bad','good','good','good','good','good','good','good']  
 
posterior1 = bayes_scalar(prior,likelihood,data)
posterior2 = bayes_vector(prior,likelihood,data)
 
if np.allclose(posterior1,posterior2):
 print('posterior1 and posterior2 are identical!')
 
fig, ax = plt.subplots()
ax.plot(posterior1[:,0])
ax.plot(posterior1[:,1])
ax.grid()
# fig.suptitle('Poeterior curve vs observed data')
ax.set_title('Posterior curve vs observed data')
plt.show()

運行以上代碼可以得到后驗概率的變化如下圖所示（注意第一個點是prior）：

當然以上代碼也順便驗證了一下兩個版本的bayes函數(shù)是完全等價的。

7. 后記

大功告成。

第1個關于貝葉斯統(tǒng)計的學習的程序和第1篇關于貝葉斯統(tǒng)計的學習的博客。

其它有的沒的等想到了什么再回頭來寫。

[Ref1] 《概率圖模型:基于R語言》,David Bellot著, 魏博譯

到此這篇關于python實現(xiàn)貝葉斯推斷的例子的文章就介紹到這了,更多相關python 貝葉斯推斷內(nèi)容請搜索本站以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持本站！

版權聲明：本站文章來源標注為YINGSOO的內(nèi)容版權均為本站所有，歡迎引用、轉載，請保持原文完整并注明來源及原文鏈接。禁止復制或仿造本網(wǎng)站，禁止在非www.sddonglingsh.com所屬的服務器上建立鏡像，否則將依法追究法律責任。本站部分內(nèi)容來源于網(wǎng)友推薦、互聯(lián)網(wǎng)收集整理而來，僅供學習參考，不代表本站立場，如有內(nèi)容涉嫌侵權，請聯(lián)系alex-e#qq.com處理。

動態(tài)撥號：關鍵詞排名下降是啥緣故，快速提高排名怎樣做

排名優(yōu)化：網(wǎng)站排名優(yōu)化方法有什么，如何做有效果

老域名：怎樣才算老域名，老域名建站有什么影響

內(nèi)容優(yōu)化：關鍵字排名要做哪些方面的優(yōu)化，怎樣做

技巧：網(wǎng)站轉化率究竟是什么，有什么提升的技巧

一下吧：外貿(mào)站優(yōu)化有哪些基本的做法和注意事項

概要：競價推廣費用大概要多少呢，競價推廣好不好

一下吧：SEO中site是什么意思，作用和應用是怎樣的

郵箱：付費郵箱有哪些優(yōu)勢，付費郵箱挑選要考慮什么

集群是什么意思：集群是什么意思，都有哪些優(yōu)勢呢