第3章信息分布答辩.pptVIP

  1. 1、本文档共60页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
信息资源管理;第3章 信息分布 Information Distribution ;在信息传递过程中产生的大量信息呈现出怎样的分布呢? 信息生产的多目的性和无序性,使信息分布十分复杂,研究具有较大难度。 文献作为信息的主要载体,具有较好的稳定性和可计量性,由此出现了一些文献信息分布的经典定律,揭示了信息管理的基本定律,对实际的信息管理具有重要的指导意义。 网络环境下信息资源的分布也成为近年来的研究热点,可以进行一些初步探讨。 ;3.1 信息产生与分布中的马太效应 ;有一家主人,远行前叫仆人来,把家业交给他们,按着各人的才干,给他们银子,一个给了五千,一个给了三千,一个给了一千。 领五千的拿去做买卖,另外赚了五千;领二千的也照样另赚了二千;领一千的把银子埋地里了。 过了许久,主人回来了,和他们算帐。领五千的说:‘主啊,你交给???五千银子,我又赚了五千。’主人说:‘好,我要把许多事派你管理。’领二千的说:‘主啊,你交给我二千银子,我又赚了二千。’主人说:‘好,我要把许多事派你管理。’领一千的掘开地说:‘主啊,你的银子在这里。’主人夺过他这一千,给那有一万的,说:‘凡是多的,还要给他,叫他有余。凡是少的,就连他所有的也要夺过来。’ ;3.1 信息产生与分布中的马太效应 ;3.1 信息产生与分布中的马太效应 ;3.1 信息产生与分布中的马太效应 ;3.1 信息产生与分布中的马太效应 ;3.2 信息内容的离散分布规律 ;1、布拉德福定律 英国著名文献信息学家布拉德福发现,某一学科领域中的相关论文在期刊中的分布是不均匀的,而且具有明显的集中与分散规律。 他在长期的观察和统计基础上,提出“布拉德福分散定律”(Bradford’s Law of Scattering),简称布拉德福定律或布氏定律。;应用地球物理学论文的布氏分布;1、布拉德福定律 布拉德福定律的区域表述(经验定律) 如果将科学期刊按其刊载某个学科主题的论文数量,以递减顺序排列,把期刊分为专门针对这个学科的核心区、相关区和非相关区。若各个区的文章数量相等,则核心区、相关区,非相关区期刊数量为1:a:a2的关系(a1,且a≈5)。 基本要点 频次等级排序,形成主体来源(期刊)的有序目录。 确定相等载文量的期刊分区,得出相关论文在主体来源中的分布规律。 ;1、布拉德福定律 布拉德福定律区域表述的数学解释 ;1、布拉德福定律 布拉德福定律的图形描述 如果横坐标取期刊按载文量递减排列时的顺序号n的对数,纵坐标取1至n号期刊所载论文的累积数,绘制 出的曲线称为布拉德福分散曲线。 ;1、布拉德福定律 布氏定律区域表述与图形描述差距的原因分析 学科界定:运用布氏定律时,必须满足严格的先决条件,即学科界限必须经纬分明。但现代科学技术互相交叉渗透,边缘学科越来越多,如本应属于情报科学的文献,也会将其归于计算机科学,从而造成统计上的误差。 数据源:应用布氏定律时,均借助于书目、索引、文摘之类的工具书。在编纂这类工具书时,编撰人员都要对原始文献进行选择和加工,统计结果没有原始文献可靠。 其他:在实际统计各种数据时,会遇到干扰,如期刊的更名、停刊、重复发表等造成统计数据的不精确。 ;3.2 信息内容的离散分布规律 ;3.2 信息内容的离散分布规律 ;2、齐夫定律 齐夫定律的经验数据 ;2、齐夫定律(Zipfs Law) 齐夫定律的表述 如果将一篇较长文章(约5 000字以上)中每个词按其出现频次递减排列起来(高频词在前,低频词在后),并用自然数给这些词编上等级序号,出现频次最高的为1级,其次为2级……这样一直到D级,如果用f表示词在文章中出现的频次,用r表示词的等级序号,则有: 式中c为常数。 ;2、齐夫定律 齐夫定律的图形表达 如果建立f与r的直角坐标系,用纵坐标表示词的等级序号,横坐标表示出现频次,就得到一条双曲线。 ;2、齐夫定律 齐夫定律图形的变形 如果等级r与频次f都取对数,则双曲线变成一条直线。与之等价的数学表达式为: ;2、齐夫定律 齐夫定律的理论基础 “省力法则”假说。齐夫认为,在语言交流过程中,说话人希望用词少,一词多义,以节省其精力。听话人希望一词一义,使听到的词与其确切涵义容易匹配,减少理解的功夫。这2种节省精力的倾向最后平衡的结果,便是词频的双曲线型分布。 “成功产生成功”假说。H.A.西蒙构造了一个概率模型:在文献中,一词使用的次数越多,再次使用的可能性越大。 普赖斯后来也建立了一个相类似的模型,并明确地提出了“成功产生成功”的假说。 ;3.3 信息生产者分布规律 ;1、洛特卡定律 统计学家洛特卡试图通过对发表论著的统计来探明科技工作者的生产能力及对科技进步和社会发展所作的贡献。 选择美国《化学文摘》和德国奥尔巴赫《物理学史一览表》为数据源研究科技工

文档评论(0)

希望之星 + 关注
实名认证
文档贡献者

我是一名原创力文库的爱好者!从事自由职业!

1亿VIP精品文档

相关文档