- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
3信息管理学基础研讨
第三章 信息分布 3.1 信息产生与分布中的马太效应 3.1.1马太效应的表现和作用形式 核心趋势 高产作者群体的形成 期刊信息密度增大 高频词汇的确立 集中取向 一篇论文多次被引 一个网站被众多用户点击 3.1.2 马太效应的负面影响 信息分布的富集现象 突出重点、摒弃平均,为信息源的选择、获取、评价和利用提供依据,降低信息管理成本,提高信息利用效益。 核心信息源 忽略分布在其他信息源中有价值的信息。 马太效应青睐名人、拒绝新人的习惯势力限制了新思想、新知识和新信息的产生及传播。 3.1.3*马太效应的数学模拟 1普利亚(Polya)分布 普利亚(Polya)分布亦称单缸模型,它基于下述实验:设某一缸中装有若干红色球和黑色球,按一定的规则从缸中取球,取到红球表示成功,取到黑球表示失败。假定缸中现有a个红球、b个黑球,取出某个球后(例如红球),则将取出球与c个红球一起放回缸中,取到黑球亦同样处理。如果实验重复n次并且假定X表示取出红球的总次数,则X的分布可表示为: P(x)=P(X=x) = (1)若c=0 P(x)= P(x)为带有参数n,a/(a+b)的二项分布 (2)若c=-1 P(x)= P(x)为带有参数n,a+b,a的超几何分布 (3)若a=b=c P(x)= P(x)为带有参数n,x的均匀分布 (4)若n →∞ ,a(a+b)-1 →0以及c(a+b)-1 →0,P(x)为负二项分布,n a(a+b)-1 和nc(a+b)-1 分别趋向于非零值 和 P(X=x)= 令 =p, P(X=x)= 2.塔格(Tague)分布 塔格(Tague)分布又称多缸模型,是对单缸模型的补充和修正。实验程序如下: ①设有一系列的缸,每个缸中装有a个红球和b个黑球; ②如果一个红球被取出,则在该缸中另外加进c个红球; ③如果黑球被取出,则不另外加进黑球; ④依次从第一个缸开始取球,一直持续到取出k个球为止 ⑤接着再从第二个缸取球,重复①~④的程序; ⑥程序①~⑤无限地延续。 在单缸模型中,x次成功的概率是在第k只黑球取出之前取出x个红球的概率。 P(X=x)= 式中,ai0, =k-1 令 = , = ,有 P(x)= 简化得, P(x)= (1 )如果k=1;满足弗林分布,其平均数为 P(x)= (2)如果 =1,弗林分布对应于瑞利分布或累积优势分布: P(X=x)= 式中,B(·, ·)为贝塔函数。 (3)在累积优势分布中,如果 =1 P(x)= 拉维昌德拉·劳在1987年提出累积优势分布的替代形式: 设u和v为两个随机变量(u=1,2,3,…,0≦v1) P(u/v)=(1-v)u-1;P(v)=(α+1)(1-v)α P(v)= P(u/v)v P(v) = (α+1)β(u,α+2) u=1,2,3,… 3.威布尔(Weibull)分布 日本的中川和大崎在1975年讨论了威布尔(Weibull)分布。由于在对失败的研究中,失败的次数常用失败的周期数来测量,所以一般用连续分布作失败分析。而随机变量具有离散性,故又称为离散的威布尔分布。中川和大崎提出了如下描述失败的概率函数: P(x)=qx β -q(x+1) β x=0,1,2,3,…β0,0q1 拉维昌德拉·劳将其改进为如下形式: P(x)=e-xβ-e-(x+1) βx=0,1,2,3,β0 平均数为 3.2 信息生产者分布规律 3.2.1洛特卡定律 1926年,统计学家洛特卡经过大量统计和研究,在美国著名的学术刊物《华盛顿科学院学报》上发表了一篇题名为“科学生产率的频率分布”的论文,旨在通过对发表论著的统计来探明科技工作者的生产能力及对科技进步和社会发展所作的贡献。 洛特卡选择美国《化学文摘》和德国奥尔巴赫《物理学史一览表》为数据源研究科技工作的论著数量分布。他统计分析了《化学文摘》1907~1916年10年累积索引中的部分作者,即姓氏以字母A和B开头的6 891位作者。分别列出发表过1篇、2篇,一直到346篇论文的人数。《物理学史一览表》包括了1900年前物理学领域内出现的1 325位物理学家及其论著,取其全部数据进行统计。 洛特卡定律的图形描述 洛特卡以论文数(x)和作者数(yx)的对数为横坐标
文档评论(0)