信息论与编码理论基础(第二章)材料.ppt

下载文档 降价啦

6
0
约7.15千字
约 44页
2016-06-28 发布于湖北
举报
版权申诉
保障服务

信息论与编码理论基础(第二章)材料.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第二章：信息量和熵 §2.1 离散型随机变量的非平均信息量（事件的信息量） §2.2 离散型随机变量的平均自信息量（熵） §2.4 离散型随机变量的平均互信息量 §2.5 连续型随机变量的平均互信息量和相对熵 §2.6 凸函数与(离散型随机变量的)平均互信息量的凸性 §2.1 离散型随机变量的非平均信息量（事件的信息量）（本章将给出各种信息量的定义和它们的性质。）定义2.1.1(非平均互信息量) 给定一个二维离散型随机变量 {(X, Y), (xk, yj), rkj, k=1~K; j=1~J} （因此就给定了两个离散型随机变量 {X, xk, qk, k=1~K}和{Y, yj, wj, j=1~J}）。事件xk∈X与事件yj∈Y的互信息量定义为 §2.1 离散型随机变量的非平均信息量（事件的信息量）其中底数a是大于1的常数。常用a=2或a=e，当a=2时互信息量的单位为“比特”。互信息量的性质：（1）I(xk; yj)=loga(rkj/(qkwj))。因此有对称性： I(xk; yj)=I(yj; xk)。（2）当rkj=qkwj时I(xk; yj)=0。（即当(rkj/qk)=wj时，I(xk; yj)=0。又即当(rkj/wj)=qk时，I(xk; yj)=0。换句话说，当“X=xk”与“Y= yj”这两个事件相互独立时，互信息量为0）。 §2.1 离散型随机变量的非平均信息量（事件的信息量）（3）当rkjqkwj时I(xk; yj)0，当rkjqkwj时I(xk; yj)0。（当(rkj/qk) wj时，I(xk; yj)0；当(rkj/qk) wj时，I(xk; yj)0。换句话说，当“X=xk”与“Y= yj”这两个事件正相关时，互信息量为正值；当“X=xk”与“Y= yj”这两个事件负相关时，互信息量为负值。） §2.1 离散型随机变量的非平均信息量（事件的信息量）定义2.1.3(非平均自信息量) 给定一个离散型随机变量{X, xk, qk, k=1~K}。事件xk∈X的自信息量定义为 h(xk)=loga(1/qk)，其中底数a是大于1的常数。自信息量的性质：（1）h(xk)≥0。（2）qk越小，h(xk)越大。（3）I(xk; yj)≤min{h(xk)，h(yj)}，即互信息量不超过各自的自信息量。证明注意到总有rkj≤min{qk, ωj}。（为什么？什么情况下相等？）。因此根据定义， I(xk; yj)≤h(xk)，I(xk; yj)≤h(yj)。得证。 §2.1 离散型随机变量的非平均信息量（事件的信息量）定义2.1.4(条件的非平均自信息量) 给定一个二维离散型随机变量{(X, Y), (xk, yj), rkj, k=1~K; j=1~J}。在事件yj发生的条件下事件xk的条件自信息量定义为 h(xk|yj)=loga(1/P(X=xk|Y=yj))=loga(wj/rkj)。（条件的非平均自信息量实际上是非平均自信息量的简单推广，只不过将概率换成了条件概率）。条件的非平均自信息量的特殊性质： h(xk|yj)=h(xk)-I(xk; yj) 。 §2.1 离散型随机变量的非平均信息量（事件的信息量）定义2.1.5(联合的非平均自信息量) 给定一个二维离散型随机变量{(X, Y), (xk, yj), rkj, k=1~K; j=1~J}。事件(xk, yj)∈(X, Y)的自信息量定义为 h(xk, yj)=loga(1/rkj)。（联合的非平均自信息量实际上是非平均自信息量的简单推广。即可以将(X, Y)直接看成是一维的随机变量）。联合的非平均自信息量的特殊性质： h(xk, yj)=h(yj)+h(xk|yj)=h(xk)+h(yj|xk)。 h(xk, yj)=h(xk)+h(yj)-I(xk; yj)。 §2.1 离散型随机变量的非平均信息量（事件的信息量）小结非平均互信息量I(xk; yj)。非平均自信息量h(xk)，h(yj)。条件的非平均自信息量h(xk|yj)， h(yj|xk)。联合的非平均自信息量h(xk, yj)。相互关系： I(xk; yj)≤min{h(xk)，h(yj)}。 h(xk|yj)=h(xk)-I(xk; yj) 。 h(xk, yj)=h(yj)+h(xk|yj)=h(xk)+h(yj|xk)。 h(xk, yj)=h(xk)+h(yj)-I(xk; yj)。 §2.2 离散型随机变量的平均自信息量（熵）定义2.2.1(平均自信息量——熵) 离散型随机变量{X, xk, qk, k=1~K}的平均自信息量（又称为熵）