- 1、本文档共83页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
熵和互信息量
第1章 熵和互信息量 本章介绍 信源的统计特性和数学模型 各类信源的信息测度----熵及其性质 引入信息理论的一些基本概念和重要结论 通信系统模型: 1.1 信源的数学模型及分类 单符号信源:输出是单个符号(代码)的消息 离散信源 连续信源 平稳随机序列信源:信源输出的消息由一系列符号序列所组成,可用N维随机矢量 X=(X1,X2,…,XN)描述,且随机矢量X 的各维概率分布都与时间起点无关----平稳! 离散平稳信源 连续平稳信源 无记忆(独立)离散平稳信源 有记忆信源 m阶马尔可夫信源 随机波形信源 离散信源(单符号) 特点:输出是单个符号(代码)的消息,符号集的取值A:{a1,a2,…,aq}是有限的或可数的,可用一维离散型随机变量X来描述。 例:投硬币、书信、电报符号等等。 数学模型:设每个信源符号ai出现的(先验)概率 p(ai) (i=1,2,…,q) 满足: 连续信源 特点:输出是单个符号(代码)的消息,输出消息的符号集A的取值是连续的,可用一维的连续型随机变量X 来描述。 例:语音信号、热噪声信号、遥控系统中有关电压、温度、压力等测得的连续数据等等。 数学模型:连续型的概率空间。即: 1.2 离散信源的信息熵及其性质 基本的离散信源可用一维随机变量X来描述信源的输出,信源的数学模型可抽象为: 信息的度量 考虑: 信息的度量(信息量)和不确定性消除的程度有关,消除的不确定性=获得的信息量; 不确定性就是随机性,可以用概率论和随机过程来测度,概率小-不确定性大; 推论: 概率小 -信息量大,即信息量是概率的单调递减函数; 信息量应该具有可加性; 信息量的推导 某事件发生所含有的信息量应该是该事件发生的先验概率的函数。即: I (ai) = f [ p(ai)] 根据客观事实和人们的习惯概念,函数 f [ p(ai)] 应满足以下条件: (1)它应是先验概率p(ai)的单调递减函数,即当 p (a1) p (a2) 时,有 f [ p (a1)] f [ p (a2) ] ; (2)当p (ai) =1时, f [ p (ai)] = 0 (3)当p (ai) =0时, f [ p (ai)] = ? (4)两个独立事件的联合信息量应等于它们分别的信息量之和。即统计独立信源的信息量等于它们分别的信息量之和。 可以证明对数函数满足上述条件: 一. 自信息 设离散信源X的概率空间为: 一点说明 计算自信息量时要注意有关事件发生概率的计算; 自信息量的单位取决于对数的底; 底为2,单位为“比特(bit, binary unit)”; 底为e,单位为“奈特(nat, nature unit)”; 底为10,单位为“哈特(hat, Hartley)”; 根据换底公式得: [例] 8个串联的灯泡x1,x2,…,x8,其损坏的可能性是等概率的,现假设其中有一个灯泡已损坏,问每进行一次测量可获得多少信息量?总共需要多少次测量才能获知和确定哪个灯泡已损坏。 解:收到某消息获得的信息量(即收到某消息后获得关于某事件发生的信息量) =不确定性减少的量 =(收到此消息前关于某事件发生的不确定性) - (收到此消息后关于某事件发生的不确定性) 已知8个灯泡等概率损坏,所以先验概率P (x1)=1/8 ,即 第二次测量获得的信息量 = I [P (x2)] - I [P (x3)]=1(bit) 第三次测量获得的信息量 = I [P (x3)] =1(bit) 至少要获得3个比特的信息量就可确切知道哪个灯泡已坏了。 二. 信息熵 对一个信源发出不同的消息所含有的信息量也不同。所以自信息I(ai)是一个随机变量,不能用它来作为整个信源的信息测度。 定义自信息的数学期望为平均自信息量Hr(X),称为信息熵: 熵的计算[例]: 有一布袋内放l00个球,其中80个球是红色的,20个球是白色的。随便摸出一个球,猜测是什么颜色,那么其概率空间为: 如果被告知摸出的是红球,那么获得的信息量是: I (a1) =-log p(a1) =-log0.8= 0.32 (比特) 如被告知摸出来的是白球,所获得的信息量应为: I (a2) = -log p(a2) = -log0.2 = 2.32 (比特) 平均摸取一次所能获得的信息量为 : H(X)= p(a1) I (a1) + p(a2) I (a2) =0.72(比特/符号) 熵的含义 熵是从整个集合的统计特性来考虑的,它从平均意义上来表征信源的总体特征。 在信源输出后,信息熵H(X)表示每个消息提供的平均信息量; 在信源输出前,信息熵H(X) 表示信源的平均不确定性; 信息熵H
您可能关注的文档
- 浅析农村职业中学数字化校园网络建设.doc
- 浅论城色彩景观规划在住宅区建设中的意义原则.doc
- 泸地方水电站石油天然气管道安全大检查深化打非治违.doc
- 测试数据库技术概述.doc
- 派河大道(潭冲路-莲花路)(翡翠路-金寨路)和仙霞路.doc
- 济南历城区中医医院医疗设备采购项目.doc
- 济南商河综合检验检测中心试验室改造项目.doc
- 济南急救中心区联网指挥大厅大屏幕改造项目招标需求.doc
- 济阳残疾人康复中心成人康复设备.doc
- 浙江2006年10月高等教育自学考试.doc
- 2024-2025学年人教版小学数学四年级下册教学计划及进度表.docx
- 2024-2025学年北师大版小学数学二年级下册教学计划及进度表.docx
- 2024-2025学年人教版小学数学五年级下册教学计划及进度表.docx
- 2024-2025学年人教大同版(2024)小学英语三年级下册教学计划.docx
- 2024-2025学年人教精通版(三起)(2024)小学英语三年级下册教学计划.docx
- 2024-2025学年统编版初中道德与法治八年级下册教学计划及进度表.docx
- 2024-2025学年统编版(2024)初中道德与法治七年级下册教学计划及进度表.docx
- 2023-2024学年上海黄埔区中考二模综合测试(物理部分)试卷及答案.pdf
- 2024-2025学年外研版(三起)(2024)小学英语三年级下册教学计划及进度表.docx
- 2025届北京市北京第四中学高三冲刺模拟数学试卷含解析.doc
最近下载
- 王牌教师的课堂管理术心得.pptx
- 陕西省名校新高考物理100实验题合集含解析.pdf VIP
- 1.1《走近世界民间美术》课件人美版(2024))初中美术七年级下册.pptx
- 2025年高考数学总复习第一部分专题突破 新趋势 高考考向练.pptx VIP
- 膨胀节设计软件简介-波纹管软件.PPT
- 山东省第二届职业技能大赛国赛农产品食品检验项目技术工作文件.pdf VIP
- 中考数学备考策略与方法课件.ppt VIP
- 2025届高考专题复习:语言文字运用中的逻辑问题.pptx VIP
- 七年级历史下册 第一单元 综合测试卷(人教陕西版 2025年春).doc VIP
- itp护理课件可编辑.pdf VIP
文档评论(0)