作為機(jī)器學(xué)習(xí)從業(yè)者,你需要知道概率分布相關(guān)的知識(shí)。這里有一份最常見(jiàn)的基本概率分布教程,大多數(shù)和使用 python 庫(kù)進(jìn)行深度學(xué)習(xí)有關(guān)。
概率分布概述
共軛意味著它有共軛分布的關(guān)系。
在貝葉斯概率論中,如果后驗(yàn)分布 p(θx)與先驗(yàn)概率分布 p(θ)在同一概率分布族中,則先驗(yàn)和后驗(yàn)稱為共軛分布,先驗(yàn)稱為似然函數(shù)的共軛先驗(yàn)。共軛先驗(yàn)維基百科在這里。
多分類表示隨機(jī)方差大于 2。
n 次意味著我們也考慮了先驗(yàn)概率 p(x)。
為了進(jìn)一步了解概率,我建議閱讀 [pattern recognition and machine learning,Bishop 2006]。
分布概率與特征
1.均勻分布(連續(xù))
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/uniform.py
均勻分布在 [a,b] 上具有相同的概率值,是簡(jiǎn)單概率分布。
2.伯努利分布(離散)
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/bernoulli.py
先驗(yàn)概率 p(x)不考慮伯努利分布。因此,如果我們對(duì)最大似然進(jìn)行優(yōu)化,那么我們很容易被過(guò)度擬合。
利用二元交叉熵對(duì)二項(xiàng)分類進(jìn)行分類。它的形式與伯努利分布的負(fù)對(duì)數(shù)相同。
3.二項(xiàng)分布(離散)
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/binomial.py
參數(shù)為 n 和 p 的二項(xiàng)分布是一系列 n 個(gè)獨(dú)立實(shí)驗(yàn)中成功次數(shù)的離散概率分布。
二項(xiàng)式分布是指通過(guò)指定要提前挑選的數(shù)量而考慮先驗(yàn)概率的分布。
4.多伯努利分布,分類分布(離散)
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/categorical.py
多伯努利稱為分類分布。
交叉熵和采取負(fù)對(duì)數(shù)的多伯努利分布具有相同的形式。
5.多項(xiàng)式分布(離散)
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/multinomial.py
多項(xiàng)式分布與分類分布的關(guān)系與伯努爾分布與二項(xiàng)分布的關(guān)系相同。
6.β分布(連續(xù))
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/beta.py
β分布與二項(xiàng)分布和伯努利分布共軛。
利用共軛,利用已知的先驗(yàn)分布可以更容易地得到后驗(yàn)分布。
當(dāng)β分布滿足特殊情況(α=1,β=1)時(shí),均勻分布是相同的。
7.Dirichlet 分布(連續(xù))
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/dirichlet.py
dirichlet 分布與多項(xiàng)式分布是共軛的。
如果 k=2,則為β分布。
8.伽馬分布(連續(xù))
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/gamma.py
如果 gamma(a,1)/gamma(a,1)+gamma(b,1)與 beta(a,b)相同,則 gamma 分布為β分布。
指數(shù)分布和卡方分布是伽馬分布的特例。
9.指數(shù)分布(連續(xù))
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/exponential.py
指數(shù)分布是 α 為 1 時(shí) γ 分布的特例。
10.高斯分布(連續(xù))
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/gaussian.py
高斯分布是一種非常常見(jiàn)的連續(xù)概率分布。
11.正態(tài)分布(連續(xù))
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/normal.py
正態(tài)分布為標(biāo)準(zhǔn)高斯分布,平均值為 0,標(biāo)準(zhǔn)差為 1。
12.卡方分布(連續(xù))
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/chi-squared.py
k 自由度的卡方分布是 k 個(gè)獨(dú)立標(biāo)準(zhǔn)正態(tài)隨機(jī)變量的平方和的分布。
卡方分布是 β 分布的特例
13.t 分布(連續(xù))
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/student-t.py
t 分布是對(duì)稱的鐘形分布,與正態(tài)分布類似,但尾部較重,這意味著它更容易產(chǎn)生遠(yuǎn)低于平均值的值。
via:https://github.com/graykode/distribution-is-all-you-need
雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)(公眾號(hào):雷鋒網(wǎng))
