- 1、本文档共56页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
信息资源管理第3章
信息资源管理;第3章 信息分布 Information Distribution;信息生产的多目的性和无序性,使信息分布十分复杂,研究具有较大难度。
文献作为信息的主要载体,具有较好的稳定性和可计量性,由此出现了一些文献信息分布的经典定律(纵向和横向)。
网络环境下信息资源的分布也成为近年来的研究热点,可以做一些初步探讨。
;3.1 信息产生与分布中的马太效应;有一个国王,远行前交给3个仆人每人一锭银子,吩咐说:“拿去做生意吧,等我回来再来见我。”
国王回来时,第一个仆人说:“国王,我用您给我的一锭银子又赚了10锭。”于是,国王奖给他10座城。
第二个仆人说:“国王,我用您给我的一锭银子又赚了5锭。”于是,国王奖给他5座城。
第三仆人说:“国王,我把您给我的1锭银子包在手帕里,怕丢了,一直没有拿出来。”
于是,国王命令,将第三个仆人的1锭银子赏给第一个仆人,说:“凡是少的,就连他所有的,也要夺过来。凡是多的,还要给他,叫他多多益善。”
;3.1 信息产生与分布中的马太效应;3.1 信息产生与分布中的马太效应;3.1 信息产生与分布中的马太效应;3.1 信息产生与分布中的马太效应;3.2 信息内容的离散分布规律;1、布拉德福定律
英国著名文献信息学家布拉德福发现,某一学科领域中的相关论文在期刊中的分布是不均匀的,而且具有明显的集中与分散规律。
他在长期的观察和统计基础上,提出“布拉德福分散定律”(Bradford’s Law of Scattering),简称布拉德福定律或布氏定律。;应用地球物理学论文的布氏分布;1、布拉德福定律
布拉德福定律的区域表述(经验定律)
如果将科学期刊按其刊载某个学科主题的论文数量,以递减顺序排列,把期刊分为专门针对这个学科的核心区、相关区和非相关区。若各个区的文章数量相等,则核心区、相关区,非相关区期刊数量为1:a:a2的关系(a1,且a≈5)。
基本要点
频次等级排序,形成主体来源(期刊)的有序目录。
确定相等载文量的期刊分区,得出相关论文在主体来源中的分布规律。
;1、布拉德福定律
布拉德福定律区域表述的数学解释
;1、布拉德福定律
布拉德福定律的图形描述
如果横坐标取期刊按载文量递减排列时的顺序号n的对数,纵坐标取1至n号期刊所载论文的累积数,绘制 出的曲线称为布拉德福分散曲线。
;1、布拉德福定律
布氏定律区域表述与图形描述差距的原因分析
学科界定:运用布氏定律时,必须满足严格的先决条件,即学科界限必须经纬分明。但现代科学技术互相交叉渗透,边缘学科越来越多,如本应属于情报科学的文献,也会将其归于计算机科学,从而造成统计上的误差。
数据源:应用布氏定律时,均借助于书目、索引、文摘之类的工具书。在编纂这类工具书时,编撰人员都要对原始文献进行选择和加工,统计结果没有原始文献可靠。
其他:在实际统计各种数据时,会遇到干扰,如期刊的更名、停刊、重复发表等造成统计数据的不精确。
;3.2 信息内容的离散分布规律;3.2 信息内容的离散分布规律;2、齐夫定律
齐夫定律的经验数据
;2、齐夫定律(Zipfs Law)
齐夫定律的表述
如果将一篇较长文章(约5 000字以上)中每个词按其出现频次递减排列起来(高频词在前,低频词在后),并用自然数给这些词编上等级序号,出现频次最高的为1级,其次为2级……这样一直到D级,如果用f表示词在文章中出现的频次,用r表示词的等级序号,则有:
式中c为常数。
;2、齐夫定律
齐夫定律的图形表达
如果建立f与r的直角坐标系,用纵坐标表示词的等级序号,横坐标表示出现频次,就得到一条双曲线。
;2、齐夫定律
齐夫定律图形的变形
如果等级r与频次f都取对数,则双曲线变成一条直线。与之等价的数学表达式为:
;2、齐夫定律
齐夫定律的理论基础
“省力法则”假说。齐夫认为,在语言交流过程中,说话人希望用词少,一词多义,以节省其精力。听话人希望一词一义,使听到的词与其确切涵义容易匹配,减少理解的功夫。这2种节省精力的倾向最后平衡的结果,便是词频的双曲线型分布。
“成功产生成功”假说。H.A.西蒙构造了一个概率模型:在文献中,一词使用的次数越多,再次使用的可能性越大。 普赖斯后来也建立了一个相类似的模型,并明确地提出了“成功产生成功”的假说。
;3.3 信息生产者分布规律;1、洛特卡定律
统计学家洛特卡试图通过对发表论著的统计来探明科技工作者的生产能力及对科技进步和社会发展所作的贡献。
选择美国《化学文摘》和德国奥尔巴赫《物理学史一览表》为数据源研究科技工作的论著数量分布。
1926年,在美国著名学术刊物《华盛顿科学院学报》发表“科学生产率的频率分布”一文。;1、洛特卡定律
洛特卡定律的图形描述
以论文数(x)和作者数(yx)的对数为横坐标(l
文档评论(0)