国模无码视频一区二区三区,免费看片A级毛片免费看,青青青国产精品一区二区

人妖在线一区,国产日韩欧美一区二区综合在线,国产啪精品视频网站免费,欧美内射深插日本少妇

公司動態(tài)

產品資訊

行業(yè)資訊

輕云服務器升級CN2線路有什么優(yōu)點

偶然從pytorch討論論壇中看到的一個問題，KL divergence different results from tf，kl divergence 在TensorFlow中和pytorch中計算結果不同，平時沒有注意到，記錄下

一篇關于KL散度、JS散度以及交叉熵對比的文章

kl divergence 介紹

KL散度( Kullback–Leibler divergence)，又稱相對熵，是描述兩個概率分布 P 和 Q 差異的一種方法。計算公式:

可以發(fā)現(xiàn)，P 和 Q 中元素的個數不用相等，只需要兩個分布中的離散元素一致。

舉個簡單例子：

兩個離散分布分布分別為 P 和 Q

P 的分布為：{1，1，2，2，3}

Q 的分布為：{1，1，1，1，1，2，3，3，3，3}

我們發(fā)現(xiàn)，雖然兩個分布中元素個數不相同，P 的元素個數為 5，Q 的元素個數為 10。但里面的元素都有 “1”，“2”，“3” 這三個元素。

當 x = 1時，在 P 分布中，“1” 這個元素的個數為 2，故 P(x = 1) = 2/5 = 0.4，在 Q 分布中，“1” 這個元素的個數為 5，故 Q(x = 1) = 5/10 = 0.5

同理，

當 x = 2 時，P(x = 2) = 2/5 = 0.4 ，Q(x = 2) = 1/10 = 0.1

當 x = 3 時，P(x = 3) = 1/5 = 0.2 ，Q(x = 3) = 4/10 = 0.4

把上述概率帶入公式：

至此，就計算完成了兩個離散變量分布的KL散度。

pytorch 中的 kl_div 函數

pytorch中有用于計算kl散度的函數 kl_div

torch.nn.functional.kl_div(input, target, size_average=None, reduce=None, reduction='mean')

計算 D （p||q）

1、不用這個函數的計算結果為：

與手算結果相同

2、使用函數：

（這是計算正確的，結果有差異是因為pytorch這個函數中默認的是以e為底）

注意：

1、函數中的 p q 位置相反(也就是想要計算D(p||q)，要寫成kl_div（q.log（），p）的形式)，而且q要先取 log

2、reduction 是選擇對各部分結果做什么操作，默認為取平均數，這里選擇求和

好別扭的用法，不知道為啥官方把它設計成這樣

補充：pytorch 的KL divergence的實現(xiàn)

看代碼吧~

import torch.nn.functional as F
# p_logit: [batch, class_num]
# q_logit: [batch, class_num]
def kl_categorical(p_logit, q_logit):
 p = F.softmax(p_logit, dim=-1)
 _kl = torch.sum(p * (F.log_softmax(p_logit, dim=-1)
- F.log_softmax(q_logit, dim=-1)), 1)
 return torch.mean(_kl)

以上為個人經驗，希望能給大家一個參考，也希望大家多多支持本站。

香港穩(wěn)定服務器

動態(tài)撥號：關鍵詞排名下降是啥緣故，快速提高排名怎樣做

排名優(yōu)化：網站排名優(yōu)化方法有什么，如何做有效果

老域名：怎樣才算老域名，老域名建站有什么影響

內容優(yōu)化：關鍵字排名要做哪些方面的優(yōu)化，怎樣做

技巧：網站轉化率究竟是什么，有什么提升的技巧

一下吧：外貿站優(yōu)化有哪些基本的做法和注意事項

概要：競價推廣費用大概要多少呢，競價推廣好不好

一下吧：SEO中site是什么意思，作用和應用是怎樣的

郵箱：付費郵箱有哪些優(yōu)勢，付費郵箱挑選要考慮什么

集群是什么意思：集群是什么意思，都有哪些優(yōu)勢呢