网站大量收购独家精品文档,联系QQ:2885784924

关于信息熵应用的讨论.doc

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
关于信息熵应用的讨论

关于信息熵应用的讨论 1 引言 信息的多少该如何度量?信息论之父香农在1948年发表的论文提出了“信息熵”的概念,用其来描述信息的不确定度。一般情况下,如果一段信息,它的出现概率很高的时候,就表示它传播的范围很广,也可以认为是被引用的程度更高,所以我们可以这样认为,从信息的传播角度来看,信息熵表征了信息的价值,这样就方便我们对信息的价值高低进行有效的衡量。其计算公式可表示如下: 其中,表示随机变量,随机变量的集合用表示,表示输出概率函数。 2 信息熵在社会领域的应用 信息熵理论的应用非常广泛,涉及到我们生活的方方面面。 前段时间的琅琊榜以及正播出的芈月传这种精品剧受到了大众的追捧,同样在收视率上表现抢眼。而收视率统计数据作为电视台评价自己的节目,确定各频道和时段广告价格及广告客户选择媒体、频道、时段和节目的重要依据。如果只是对节目播出后进行调查分析显然已经无法满足电视台和广告商的期望。对于电视台方面来说,节目的播出前收视预测能帮助实现节目的精细化制作并获取期望的效果;对于广告商收视预测则明显能减小投资风险。我们知道信息熵是对不确定性的度量,显然其很可能在此处发挥作用。我们可以对一个节目分为多个属性,如艺术水平、题材流行程度、编导人气、受众文化程度、受众经济情况、受众性别、受众年龄等等,再然后加上一个已获得的收视率属性,对属性进行等级或者分数记录。选取样本数据并分别统计,然后计算给定样本集的收视率熵,从而得到样本的平均信息量,再分别计算每个属性的熵,计算信息增益值,从结果中就很容易知道哪个属性在其中具有最高信息增益,即信息熵最小的属性。这个属性作为最先决策的考虑,然后在此基础上再计算其他的信息熵最小属性,作为第二决策考虑,依次类推,生成决策树。基于信息熵的预测收视率模型已有研究成果,并且证明预测效果很好,比较适合用于影响因素多,样本数据库大的电视节目的收视率分析[1]。 对于电视台和广告商,信息熵有巨大的利用价值,那对于为整个娱乐产业操碎了心的广电总局,信息熵是否也有其参考价值呢?假如把观众与电视频道作为一个相对封闭的互动系统,那么观众对频道选择的趋同或者多样就是这个封闭系统非常重要的一个表明系统复杂性的特征。这个系统中观众观看电视频道的复杂度可以用信息量来度量,观众对频道收视选择越一致,对系统状态进行确认所需要的信息量越小;反之,观众收视选择越分散,则对系统状态进行确认所需要的信息量越大。这个信息量的大小可以通过计算信息熵获得。以观众对不同频道的收视率转换为收视概率并计算信息熵。通过观察信息熵的趋势来评判这个系统的无序性。根据此处所定义的信息熵,广电总局可以比较简单明了的了解全国电视频道的整体有序、无序状态,从而采取适当的宏观调控措施。 除此之外,信息熵在其他领域也受到了研究者的亲睐。如在学生评教结果分析,教育信息处理,电子数据取证,图书分类决策,煤炭企业经济效益评价等等研究中,信息熵都能发挥重要作用。 3 信息熵在科学领域的应用 结合信息熵的性质,它的应用非常广泛,即使在我所研方向模拟电路设计中它也发挥着不可忽视的作用。在电子电子工艺愈来愈追求高度集成的过程中,维护的难度也相应提高,当一个系统出现故障的时候,进行有效且较为精准的故障诊断及其重要。尤其对于模拟电路,限于其复杂、非线性、易产生误差、容差等特性,故障诊断无疑成为了困扰着集成电路工业发展的一个“瓶颈”。而将信息熵应用于模拟电路故障诊断可以取得不错的效果,成为研究热点。其理论主要应用在对故障电路特征的提取中。其中,长春理工大学的王庆元就用香农熵对电路故障状态的不确定性进行描述,将测量前后电路的熵值变化量作为电路故障状态的诊断信息量,并以诊断信息量为依据,采用粒子群优化算法来进行电路故障状态的最佳特征子集的选取[2]。结果表明利用该方法所获得的特征子集携带电路故障信息最多,可以充分反映电路的各类故障状态,进行有效的故障隔离。在故障特征提取的过程中,我们的目的是找到一个相同容量下能够含有最大的利于进行故障分类的信息的特征集合,即含有最大诊断信息量的特征集合。一个特征集合的诊断信息量可以定义为在该特征集合上对电路进行测量前后的电路状态的不确定性的变化[4]。所以我们要引用信息熵的概念来计算出这个电路在测量前和测量后电路故障状态的不确定性,即要计算出测点的先验熵以及后验熵。特征集合的诊断信息量反映了其所携带诊断信息量的多少,可以作为选择最优特征集合(即特征提取)的重要依据。事实上,在特征提取中,我们需要做的就是要找到I(X)(先验熵减去后验熵)的最优解,就可在全体特征集合中寻找到具有最大诊断信息量的最优特征子集。 他所用到的基于信息熵的特征提取方法在其他研究中也有很大的应用价值。如,文献[3]燕山大学的谢平、周志丰在掌纹的特征提取中,将小波图像分析与信息熵理论相结进行特征提取

文档评论(0)

haihang2017 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档