- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
6.信息计量方法PPT
二、文献计量学方法的理论基础 (三)齐普夫定律 齐普夫定律:如果把一篇较长的文章中的每一个词出现在频次统计,按照高频词,低频词的前后顺序排列,并用自然数给他们加以编号。编号和频次的乘积是一个常数。 二、文献计量学方法的理论基础 (三)齐普夫定律的图像描述 横坐标:等级序号r 纵坐标:相应的频率f 等级r与频率f均取对数。 虚线:lnr+lnf=lnc 实线:blnr+lnf=lnc (斜率为b) 二、文献计量学方法的理论基础 (三)齐普夫定律的局限性 对出现频率特别高的词和特别低的词,并不能完全地反映分布规律 低频率的词,序号相同的很多 高频率的词,序号相同的词随着频率的增高而越来越少 二、文献计量学方法的理论基础 (三)齐普夫定律的应用 文献标引和词表编制 信息检索 在图书情报管理中的应用 二、文献计量学方法的理论基础 (三)齐普夫定律的应用词表编制 叙词表和标引可以提高计算机检索的效率 根据齐普夫定律的频率分布方法,通过标引试验,找出被标引文献与叙词使用频率的分布特征,确定合乎需要的参数值。 选用原始文献中的术语,统计其发生的频率,研究分布特征,最后决定合乎使用频率的词 二、文献计量学方法的理论基础 (三)齐普夫定律的应用文献标引 自动标引 利用计算机对每一个词的频率进行统计分析,筛选出适合标引的词汇。 卢恩(Luhn)的频率自动索引方法 去掉高频词 去掉后缀 找出相应的词干 二、文献计量学方法的理论基础 (三)齐普夫定律的应用信息检索 用于估计信息检索系统所需要的存储量 倒排文档的大小,取决于同属性字段中不同词的数量以及每个词的出现频率(一个数据库至少包括一个顺排文档和一个倒排文档。顺排文档是将数据库的全部记录按照记录号的大小排列而成的文献集合,它构成了数据库的主体内容。在倒排文档中,记录的特征标识作为排列依据,其后列出含有此标识的记录号,使用倒排文档可以大大提高检索的效率。 ) 按照齐普夫定律,计算词频出现的几率。 二、文献计量学方法的理论基础 (三)齐普夫定律的应用在图书情报管理中的应用 处理与语言文字有关的问题 将“最省力法则”的原理应用于图书情报信息事业的管理 合理选择图书馆或者信息中心的最佳地理位置,使得使用者能以最省力途径方便到达 用以设计图书馆、信息中心资料库的排架 二、文献计量学方法的理论基础 (四)文献信息增长规律 1944年,美国韦斯莱大学图书馆馆员弗里蒙特·赖德(Fremont Ryder)发现: 美国主要大学图书馆的藏书量 平均每16年递增1倍 普赖斯 把这一发现推广到科学知识的全部领域,并进行了一系列研究。 普赖斯曲线 1949年,普赖斯在新加坡大学任职时发现: “一叠叠的(10年一叠)《英国皇家学会哲学汇刊》靠墙竟堆成了一条完美的指数曲线”。 普赖斯曲线 以文献量为纵轴 以历史年代为横轴 从1750年起,科学期刊的数量大约每50年增长10倍。 F(t)=aebt (a0, b0) (四)文献指数增长模型 科学文献“按指数增长的规律”: 似乎没有理由怀疑:任何正常的、日益增长的科学领域内的文献是按指数增加的,每隔大约10年到15年时间增加一倍。 每年增长约5%~7% F(t)=aebt (a0, b0) 同等利息ft是总和,a是本金,b是利率,t是时间,e是自然对数的底(e=2) F(t):t时间点的文献总数 t:时间,以年为单位 a:条件常数,统计初始时刻(t=0)时的文献量 e:自然对数的底 b:时间常数,即持续增长率 文献指数增长律的局限性 科学文献并不是总按指数函数关系增长 会受到统计时间和文献类型的影响 指数规律不能预测文献的未来增长趋势 ?F(t)=aeb(t+1)-aebt=a(eb-1)ebt 当t→∞时, ?F(t) →∞ 存在局限性的原因 没有考虑文献日益严重的老化因素 在统计某年的学术期刊累积总数时,并没有排除已经停刊的期刊 特定文献类型:学术期刊文献 特定知识领域:化学,物理等 特定统计时间范围内 如果按照指数增长,势必有一天,人人都是科研人员,科研经费占国民生产总值的100%。也难以满足科学文献的无限增长的需求。 3 学术文献的逻辑增长规律 文献的逻辑增长模型 文献逻辑增长规律的分析 文献逻辑增长的修正 逻辑增长模型 富士康跳楼曲线 文献逻辑增长模型 文献逻辑增长模型的数学表达式 F(t):为t年的文献累计量 K:当t→∞时的文献累计量,即文献累计量的最大值 a,b:参数同指数增长模型 前期缓慢,中期加速,后期缓慢,直至饱和 文献逻辑增长模型 文献逻辑增长模型的意义 当F(t)=yk时, 曲线增长率:dy/dt=kby 曲线的相对增长率:(dy/dt)/y=kb=const 科学文献的增长的初始阶段符合
文档评论(0)