KL divergence(KL 散度)
KL散度(Kullback-Leibler (KL) divergence)通常用来衡量两个单独的概率分布的差异,设对于同一随机变量的两个概率分布为P(x)和Q(x),则它们的KL散度定义为:
DKL(p∣∣q)=Ex∼P[logP(x)−logQ(x)]
KL散度具有的性质有:
- 非负:要使得KL散度为0,当且仅当P(x)和Q(x)是在离散型变量的情况下是相同的分布,或者在连续型变量的情况下是“几乎处处”相同的[1]。
- 非对称:对某些P(x)和Q(x),KL散度和逆KL散度通常并不相等,也就是DKL(P∣∣Q)=DKL(Q∣∣P)。
本文将从三个角度分析KL散度的非对称性:直观看法,理论说明,计算实验。
阅读全文…