- 94
- 0
- 约 54页
- 2017-09-13 发布于江苏
- 举报
情报学基础教程nIntroductiontoInformationScience(修订
1.2.1 基础数据和规律表述 洛特卡定律描述了作者人数与其发表论文之间的关系,首次揭示了作者与发表论文数量之间存在的规律。 后经研究,发现物理学等学科领域的作者与论文之间的关系基本符合平方反比律,而生物、工程、计算机等领域则不符合平方反比关系。一般来说,人文学科、社会科学中,a值将变大;规模较大、科研合作程度较高的学科中,a值会变小。 1.2.2 改进与扩展 虽然洛特卡定律早在1926年就提出,但直到1949年才被称为“洛特卡定律”。 著名科学学家普赖斯(D.Price)就在洛特卡定律基础上进一步研究了科学家人数和科学论文数量之间的关联,在《小科学,大科学》一书中提出了“普赖斯定律”:科学家总数是杰出科学家人数的平方(或者说杰出科学家人数是科学家总数的平方根)。普赖斯定律的另一定量表达是:杰出科学家发表了全部科学论文的50%。 1.2.2 改进与扩展 设 为杰出科学家中最高产作者发表论文数,m为杰出科学家中最低产作者发表论文数,R为杰出科学家人数与全体科学家总数之比,则普赖斯推导出了以下两式: 1.2.3 应用提示 洛特卡定律主要用于研究“科学生产率”,可用于预测发表不同篇数论文的作者数量和特定学科的论文总量,或根据作者数量估计科学论文数量等。 为合理评价洛特卡定律的适用性,美国情报学家科尔(R.C.Coile)于1977年提出用K-S(Kolmogorov-Smirnov)检验法对其进行鉴定,其步骤为: (1)设A为统计的作者总数,计算K-S值: (2)计算最大偏差值D:D=Max|F0(x)-Sn(x)|;其中 F0(x)为累积作者频率理论值,Sn(x)为累积作者频 率观察值; (3)比较D与KS:若DKS,则抽样分布符合洛特卡定 律;若DKS,则抽样分布不符合洛特卡定律。 1.3 齐夫定律 齐夫定律是描述文献中的词与其出现频次之间关系的经验规律,由齐夫(G.K.Zipf)于1935年提出,是一条与语言学密切相关的文献学规律。 本节主要内容: 1.3.1基础数据和规律表示 1.3.2 改进和扩展 1.3.3 应用提示 1.3.1 基础数据和规律表述 齐夫在1949年出版的《人类行为与最省力法则》(Human behavior and the principle of least effort)专著中,系统地将他的发现整理为一条规律: 设有一篇含有N个词的文献(N≥5000),用自然数1,2,3,…给文献中的词编级,出现频次最高的为1,其次为2,直到r (rN),则高频词的频次f与词级r的乘积是一个常数: 其中0c/N1。这就是齐夫定律,也称齐夫第一定律。齐夫本人用最省力法则作为该定律的机理。 1.3.2 改进和扩展 针对高频词 1936年,美国语言学家朱斯(M.Joos)提出含两个参数的齐夫公式: 这是双参数词频分布律,其中b0,c0。当b=1时,等价于齐夫单参数公式。 1.3.2 改进和扩展 针对高频词 1952年,美籍法国数学家曼德布罗(B.Mandelbrot)运用信息论原理和概率论方法研究了词频分布规律,重新解释了齐夫定律,提出了三参数词频分布律: 其中0≤a1,b0,c0。该公式当a=0时,就是朱斯双参数公式;当a=0,b=1时,就是齐夫单参数公式,因而三参数公式具有更广的适用性。 1.3.2 改进和扩展 针对低频词 布斯(B.Booth)首先导出低频词的分布规律: 设出现1次的词数量为I1,出现n次的词数量为In,则低频词满足公式: 上式也称为齐夫第二定律。 1.3.3 应用提示 齐夫定律主要可用于指导文献标引、词表编制和情报检索等,尤其是在自动标引中具有应用价值,因为使用频率太高的词和使用频率太低的词都没有多少检索价值,故应当使用词频适中、词义强健的词作为标引词。 1.4 文献增长律 文献增长律是描述文献信息量随时间而不断增加的规律 。 文献增长律主要有以下模型 : 指数曲线 逻辑曲线 勒歇尔模型 1.4.1 指数曲线 普赖斯(D. Price)在1961年正式出版的《巴比伦以来的科学》中,系统地提出了科技文献按指数规律增长的经验规律。 设t时间的文献信息数量为Q=F(t),则有: 其中a0为条件常数,代表t=0时刻的Q;b0为时间常数,代表持续增长率;e=2.718;t通常以年计算。 1.4.1 指数曲线 因此,有“信息爆炸”之说。然而,实际上文献信息的增长是有限的,这表明指数增长律只是一条近似规律,故产生以下改进模型。 1.4.2 逻辑曲
您可能关注的文档
- 威海三中201年音乐体育科技创新特长生.doc
- 孝感市主要廉政险及防控措施一览表.doc
- 学习目标掌握常病句的类型。了解修改病句的方法能准.ppt
- 学习目标1.《经》、《离骚》及其对后世的影响;2.诗.ppt
- 学习目标1、能对我国劳动号子和劳动歌曲感兴趣,喜欢.ppt
- 学年度农业类科生技艺竞赛森林职种森林职种-笔试(术科.PDF
- 学习简报岑溪市012国培计划——广西无网络条件边远.ppt
- 学术学位硕士研生招生相关科目参考书.PDF
- 学术期刊发表英撰写季刊台湾研究者最专业的学术英文杂志.PDF
- 学校编码1504分类号密级.doc
- 河北盐山中学等校2025-2026学年上学期高三一模化学试卷(含解析).docx
- 河北正定中学2025-2026学年高一上学期期末考试物理试卷(含解析).docx
- 河北张家口市怀安县2025-2026学年第一学期期末教学综合评价八年级地理试卷(含解析).docx
- 河南安阳市殷都区2025-2026学年第一学期期末教学质量检测七年级地理试卷(含解析).docx
- 河南安阳市滑县2025一2026学年第一学期期末学业质量监测八年级地理试题(含解析).docx
- 河南安阳市林州市2025-2026学年上学期期末考试高一政治试题(含解析).docx
- 河南焦作市武陟县第一中学2025-2026学年高一上学期1月月考语文试卷(含解析).docx
- 河南济源市2025-2026学年上学期期末学业质量调研七年级历史试卷(含解析).docx
- PICC导管并发症的紧急处理与护理.pptx
- 河南鹤壁市2025-2026学年高二上学期期末考试生物试题(含解析).docx
最近下载
- 长庆一氧化碳中毒事故案例分析.ppt VIP
- 2019创新思维考试.doc VIP
- 数学人教版九年级上册用列举法求概率.2用列举法求概率.pptx VIP
- 《工厂供电》课设计指导书.doc VIP
- 《历代名画记》与《法书要录》.docx VIP
- 心电监护常见心律失常的识别及处理医学64页PPT.pptx VIP
- (网络参考版)广西2025年高考真题历史试卷(含答案).docx VIP
- 中兴VUE-NR高级认证(52-115)练习试题.doc VIP
- 基于改进YOLOv5s算法的城市道路交通场景目标检测研究.pdf VIP
- 高中英语高考复习动词时态专项练习(共70题,附参考答案和解析).docx VIP
原创力文档

文档评论(0)