- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
龚光鲁,钱敏平著 应用随机过程教程 – 与在算法和智能计算中的应用
清华大学出版社, 2004
第 10章 隐马氏模型 (Hidden Markov Model,HMM)及其应用
1. 熵与相对熵
1. 1离散分布的熵与相对熵
熵的概念出自 C.Shannon.引进这个指标的目的在于刻画一个离散分布(一个离散随机
变量)或一个分布密度(一个连续型随机变量)的不确定性的大小.也就是说知道了此随机变量
的取值所获得的信息的大小.
定义10.1 对于离散分布p (p , L, p ,L) ,我们定义它的熵为
1 n
H(p)= .
p i ln p i
i
又定义分布p关于分布q (q ,L, q ,L) 的Kullback- Leibler相对熵为
1 n
p i
h(p,q)= p ln .
i
i qi
命题10.2 相对熵h(p,q)≥0,而且h(p,q)=0,当且仅当p =q时成立等号.
D
证明 [0, ) 上函数g (t ) t 1 ln t 在t 1时恒正 (这一结论可由g的导数直接可以看
qi qi qi p i qi
出),且g (1) 0 . 取t ,于是ln ≤ -1,即ln 1 ,而且等号仅当
p i p i p i qi p i
p i
1时成立.从而有
qi
p i qi
p i ln p i (1 ) 0 .
i qi i p i
所以结论成立.
这个命题表明,相对熵在相当程度上表达了 p与q的差别:当p=q时,h(p,q)=0.而
当所有的p 都与q 接近时,h(p,q)就很小.从而 h(p,q)可以看成 p与 q之间的一种
i i
“准距离”.这里我们之所以称它为准距离,是因为它既不对称 (即 h(p,q) h(q,p)),
也不满足三角形不等式。所以不满足第9章中的距离公理.
例 10.3 (有限个值的分布的熵)
分布p (p 1, L,p N ) 的熵满足
H(p)= p i ln p i ln N .
i
N N
且等号当且
文档评论(0)