一笔“划算的交易”程序.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
报告人:林枫 小组成员:鲍宏德、林枫、李雁南 压缩 衣服通过“压缩”才能装进行李箱 ——便于携带 类似地,数据可以通过“压缩”打包 ——便于信息的传播与交流 1.人们对“概率”的认识 2.C.E.Shannon与信息论 远早于计算机的出现! 1948年 《通信的数学理论》(A Mathematical Theory of Communication) (发表于《贝尔系统技术杂志》第27卷) 信息论的 “开山之作”! 字面上看:多余的信息 传播学理论:信息中包含的、不影响信息完整的的那一部分。 事实上信息冗余可以理解为: 传输信息所用数据位的数目 与信息中所包含的实际信息的数据位的数目的差值,即 “不成为目标信息的那一部分”。 例1: —你比赛赢了么? —第一局我赢了,第二局他赢了,第三局还是我赢了。 例2:—吃过了啊?(打招呼的一种方式) 香农指出:任何信息都存在冗余,冗余大小与信息中每个符号(数字、字母、单词)的出现概率或者说不确定性有关系。用冗余度表征这种信源信息的不确定性。 质的评估:难以评定(超出自然科学范围、缺乏统一标准) 量的评估:较好评价,是当代信息论的出发点 冗余度与信息的“量”紧密相关 例1:马上要举行世界杯赛了。大家都很关心谁会是冠军。假如我错过了看世界杯,赛后我问一个知道比赛结果的观众“哪支球队是冠军”,他不愿意直接告诉我, 而要让我猜,并且我每猜一次,他要收一元钱才肯告诉我是否猜对了,那么我需要付给他多少钱才能知道谁是冠军呢? 我可以把球队编上号,从1到32, 然后提问: “冠军的球队在 1-16 号中吗?” 假如他告诉我猜对了, 我会接着问: “冠军在 1-8 号中吗?”假如他告诉我猜错了, 我自然知道冠军队在 9-16 中。这样最多只需要五次,我就能知道哪支球队是冠军。所以,谁是世界杯冠军这条信息的信息量只值五块钱。 定义1 从两种可能性中作出判断需要的信息量为1 bit. 由此,我们知道上述例1中谁是世界杯冠军这条信息的信息量为5bit. 例2:甲手持一张扑克牌让乙猜是什么花色的。对乙的提问,甲只能回答“是”或“不是”,要求乙尽可能少地提问并猜中花色,那么乙该如何发问?最少次数是多少? 错误问法:“是黑桃吗?” 正确问法:“是黑的吗?”“是桃吗?” 因此:•从4种可能性中作出判断所需要的信息量为 2 bit. 由上述定理我们知道: 作出判断需要的次数越多,需要的信息量越大,也就意味着缺少的信息量越多。 因此信息量的度量实际上与我们的判断紧密相关,而我们的判断又与我们对事件的 了解相联系。对于有N种可能性的事件,在不了解它的时候,它是具有不确定性的。我们 只能假设每种事件出现的概率均为 。但现实中并非所有事件都是等可能事件,比如:猜 测世界杯的冠军很可能不需要5次,因为巴西、德国、意大利等少数几支球队获胜可能性比 其他球队要大很多。那么,这种情况下,香农便引入了“熵”的概念。 •从8种可能性中作出判断所需要的信息量为 3 bit. •从16种可能性中作出判断所需要的信息量为 2 bit. …… 依次类推,可以得到如下定理: 定理1 从N种可能性中作出判断所需要的信息量为 或者写成: 其中 • 热力学中,“熵”是一个状态函数,用于表征系统的混乱、无序的程度。 热力学熵满足玻尔兹曼公式: 这里Ω为与某一宏观状态对应的微观状态数。 事实上,我们发现所谓“混乱、无序”,在某种意义上就是一种不确定性,是一种缺乏规律的表现。 •Shannon引入热力学中“熵”的概念,来表征信息的不确定性。 在事件N种可能性相等,均为 的情况下,Shannon告诉我们: 定理2 作出完全判断所需要的信息量为 可以改写为 Shannon把S称为信息熵(又叫香农熵). 可以发现:Shannon的公式与玻尔兹曼公式具有相同形式。本质上,信息熵与热力学熵具有统一性。且两常数有换算公式:K=k 即1bit=kln2 J/K •香农熵表征信息量的缺损,是对信息不确定性的衡量。 香农熵减少,意味着信息量的增加;反之则意味着信息量的减少。信息量与信息熵是反相关的。 •香农熵与冗余度——描述 •香农熵的推广公式: 定理4 对于N种不完全相同可能性的情况,信息熵的大小由下式给出 3.数据压缩与信息熵 • 本质上而言数据压缩的目的就是为了消除信息中的冗余。 在实现更接近实际信息描述前提下

文档评论(0)

1112111 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档