关于信息熵应用的讨论.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
关于信息熵应用的讨论 1 引言 信息的多少该如何度量?信息论之父香农在 1948 年发表的论文提出了“信 息熵”的概念,用其来描述信息的不确定度。一般情况下,如果一段信息,它的 出现概率很高的时候, 就表示它传播的范围很广, 也可以认为是被引用的程度更 高,所以我们可以这样认为, 从信息的传播角度来看, 信息熵表征了信息的价值, 这样就方便我们对信息的价值高低进行有效的衡量。其计算公式可表示如下: H (X) P( x)lb P(x) X 其中,x 表示随机变量, 随机变量的集合用 X 表示, P(x ) 表示输出概率函数。 2 信息熵在社会领域的应用 信息熵理论的应用非常广泛,涉及到我们生活的方方面面。 前段时间的琅琊榜以及正播出的芈月传这种精品剧受到了大众的追捧, 同样 在收视率上表现抢眼。 而收视率统计数据作为电视台评价自己的节目, 确定各频 道和时段广告价格及广告客户选择媒体、 频道、时段和节目的重要依据。 如果只 是对节目播出后进行调查分析显然已经无法满足电视台和广告商的期望。 对于电 视台方面来说, 节目的播出前收视预测能帮助实现节目的精细化制作并获取期望 的效果;对于广告商收视预测则明显能减小投资风险。 我们知道信息熵是对不确 定性的度量,显然其很可能在此处发挥作用。 我们可以对一个节目分为多个属性, 如艺术水平、题材流行程度、编导人气、受众文化程度、受众经济情况、受众性 别、受众年龄等等, 再然后加上一个已获得的收视率属性, 对属性进行等级或者 分数记录。 选取样本数据并分别统计, 然后计算给定样本集的收视率熵, 从而得 到样本的平均信息量, 再分别计算每个属性的熵, 计算信息增益值, 从结果中就 很容易知道哪个属性在其中具有最高信息增益, 即信息熵最小的属性。 这个属性 作为最先决策的考虑, 然后在此基础上再计算其他的信息熵最小属性, 作为第二 决策考虑,依次类推,生成决策树。基于信息熵的预测收视率模型已有研究成果, 1 并且证明预测效果很好, 比较适合用于影响因素多, 样本数据库大的电视节目的 收视率分析 [1] 。 对于电视台和广告商,信息熵有巨大的利用价值,那对于为整个娱乐产业操 碎了心的广电总局, 信息熵是否也有其参考价值呢?假如把观众与电视频道作为 一个相对封闭的互动系统, 那么观众对频道选择的趋同或者多样就是这个封闭系 统非常重要的一个表明系统复杂性的特征。 这个系统中观众观看电视频道的复杂 度可以用信息量来度量, 观众对频道收视选择越一致, 对系统状态进行确认所需 要的信息量越小; 反之,观众收视选择越分散, 则对系统状态进行确认所需要的 信息量越大。 这个信息量的大小可以通过计算信息熵获得。 以观众对不同频道的 收视率转换为收视概率并计算信息熵。 通过观察信息熵的趋势来评判这个系统的 无序性。根据此处所定义的信息熵, 广电总局可以比较简单明了的了解全国电视 频道的整体有序、无序状态,从而采取适当的宏观调控措施。 除此之外,信息熵在其他领域也受到了研究者的亲睐。如在学生评教结果分 析,教育信息处理

文档评论(0)

lh2468lh + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档