- 1、本文档共27页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章 信源与信息熵.doc
第二章 信源与信息熵
主要内容:(1)信源的描述与分类;(2)离散信源熵和互信息;(3)离散序列信源的熵;(4)连续信源的熵和互信息;(5)冗余度。
重 点:离散/连续信源熵和互信息。
难 点:离散序列有记忆信源熵。
说 明:本章内容主要针对信源,但是很多基本概念却是整个信息论的基础,所以安排了较多课时。由于求熵涉及一些概率论的基础知识,考虑到大四的同学可能对这部分知识已经遗忘,故适当复习部分概率论知识。较难的2.1.2节马尔可夫信源部分放置在本章最后讲,便于同学理解。本章概念和定理较多,比较抽象,课堂教学时考虑多讲述一些例题,通过例题来巩固概念和消化定理。
作 业:
2.1—2.7,2.10,2.12。
课时分配:10课时。
板书及讲解要点:
在信息论中,信源是发出消息的源,信源输出以符号形式出现的具体消息。如果符号是确定的而且预先是知道的,那么该消息就无信息而言。只有当符号的出现是随机的,预先无法确定,一旦出现某个符合就给观察者提供了信息。因此应该用随机变量或随机矢量来表示信源,运用概率论和随机过程的理论来研究信息,这就是香农信息论的基本点。
2.1 信源的描述与分类
在通信系统中收信者在未收到消息以前对信源发出什么消息是不确定的,是随机的,所以可用随机变量、随机序列或随机过程来描述信源输出的消息,或者说用一个样本空间及其概率测度——概率空间来描述信源。
信源:产生随机变量、随机序列和随机过程的源。
信源的基本特性:具有随机不确定性。
信源的分类
离散信源:文字、数据、电报——随机序列
连续信源:话音、图像——随机过程
离散信源:输出在时间和幅度上都是离散分布的消息。
消息数是有限的或可数的,且每次只输出其中一个消息,即两两不相容。
发出单个符号的无记忆信源
离散无记忆信源: 发出符号序列的无记忆信源
离散信源
离散有记忆信源: 发出符号序列的有记忆信源
发出符号序列的马尔可夫信源
完备性
联合概率
贝叶斯公式
2.1.1 无记忆信源:
例如扔骰子,每次试验结果必然是1~6点中的某一个面朝上。可以用一个离散型随机变量X来描述这个信源输出的消息。
并满足
在实际情况中,存在着很多这样的信源、例如投硬币、书信文字、计算机的代码、电报符号、阿拉伯数字码等等。这些信源输出的都是单个符号(或代码)的消息,它们符号集的取值是有限的或可数的。
我们可用一维离散型随机变量X来描述这些信息的输出。这样的信息称为离散信源。
其数学模型就是离散型的概率空间, 0≤p(xi)≤1
p(xi):信源输出符号xi(i =1,2,…,n)的先验概率。
上式表示信源可能的消息(符号)数是有限的,只有n个x1 ,x2 ,… ,xn,而且每次必定选取其中一个消息输出,满足完备集条件。这是最基本的离散信源。连续信源:输出在时间和幅度上都是连续分布的消息。
消息数是无限的或不可数的,且每次只输出其中一个消息。
我们可用一维的连续型随机变量X来描述这些消息。其数学模型是连续型的概率空间
, 并满足 p(x)是随机变量X的概率密度函数。很多实际信源输出的消息是由一系列符号组成,这种用每次发出1组含2个以上符号的符号序列来代表一个消息的信源叫做发出符号序列的信源。需要用随机序列(随机矢量) X =(X1X2…Xl…XL)来描述信源输出的消息,用联合概率分布来表示信源特件。
例如扔骰子:
符号序列信源是L为3的情况,此时信源X =(X1X2X3),Xl取={0,1}
离散随机序列X的样值x可表示为
x = (x1…x1…xL)
x ∈ nL= n×n×…×n(共L个),即每个随机变量取值有n种,那么L个随机变量组成的随机序列,其样值共有nL种可能取值。
有时将这种由信源X输出的L长随机序列X所描述的信源叫做离散无记忆信源X的L次扩展信源。
其对应的概率为:
当信源无记忆时:
p(x) = p(x1x2…xL)
= p(x1) p(x2)…p(xL)
=
扩展信源也满足完备性
2.1.2有记忆信源
一般情况下,信源在不同时刻发出的符号之间是相互依赖的,也就是信源输出的平稳随机序列X中,各随机变量Xl之间是有依赖的。如在汉字序列中前后文字的出现是有依赖的,不能认为是彼此不相关的。源
表述的复杂度将随着序列长度的增加而增加。
实际上信源发出的符号往往只与前若干个符号有较强的依赖关系,随着长度的增加依赖关系越来越弱,因此可以根据信源的特性和处理时的需要限制记忆的长度,使分析和处理简化。
在实际应用中还有一些信源输出的消息不仅在幅度上是连续的,在时间上或频率上也是连续的,即所谓的模拟信号。如话音信号、电视图像信号等
文档评论(0)