网站大量收购独家精品文档,联系QQ:2885784924

信息资源的数量和来源.pptVIP

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

自动编制文摘(Automaticabstracting):指利用计算机对文献文本进行扫描分析,自动生成文摘的过程和技术。自1958年开始试验以来,一些机构已开发出各种不同的系统原型。自动编制文摘的基本原理是:将文章输入计算机中,或加以必要的预编辑;确定抽取“文摘句”的标准,建立一套计算文中各个词和句子的分值的方法;计算机根据给定的标准和方法分析文章全文,选出一批文摘句,加以润色和组织成一篇完整而连贯文摘,打印输出。其中最关键的技术是文摘句的识别和加工润色操作(即格式化编辑)。自动标引自动标引(automaticindexing)是指标引作业全部或部分实现自动化的过程。美国自动标引专家斯蒂芬曾给它下过这样的定义:“自动标引就是用机器抽取或赋予索引词,一旦编制好程序和规则,就不需要人工干预。”由于历来自动标引使用的机器都是计算机,故又称计算机标引(computerizedindexing;computer-basedindexing)。自动标引可分为自动抽词标引和自动赋词标引。自动抽词标引指利用计算机直接从文献的机读文本(题名、文摘或正文)中抽取*关键词,自动生成关键词索引或检索文档的过程。它又可分为主关键词标引和全关键词标引。前者要求计算机能选出少量主要关键词做*标引词,后者则是把除停用词以外的全部关键词抽出做标引词。自动赋词标引指用计算机模仿人的赋词标引方法,分析文献内容,提取主题概念,然后用适当的语词符号描述这种概念。信息过滤技术信息过虑(Informationfiltering)就是信息的选择性传播。信息过虑技术面向非结构化及半结构化的数据,主要用于处理文本信息。信息过滤关注用户在一段时间内比较固定的信息需求,其目标是帮助用户处理大量的信息,对动态的信息流进行筛选。它基于用户需求大纲(profile),从输入的信息流中滤掉用户不希望得到的信息。随着internet的迅猛发展和广泛使用,“信息过载”和“不良信息”问题日趋严重。如何能够更有效、更准确地找到自己感兴趣的信息,滤除与自己的需求无关的信息已成为基于Internet网络信息查询的当务之急。信息过滤技术信息过滤技术可从3个方面分类:01根据操作的主动性分为主动或被动过滤技术;02根据操作的位置可分为代理服务器过滤或客户端过虑;03根据过滤方法分为认知过滤、社会学过滤及经济学过滤。04信息提取技术信息提取技术(InformationExtraction)从诞生至今已约有30多年的历史了,最近十几年得到特别重视,并且成为信息检索、数据库和自然语言处理等领域发展的热点。原因是传统的信息检索只能向用户提供相关性的结果,是否对用户有用还需要用户自己去判断。面对网络时代信息量快速膨胀,以及信息用户要求提供精确和有用的直接信息的双重压力,信息服务提供者必须掌握能更有效地分析信息并从海量信息中提取重要或关键信息的手段。信息提取技术的要点在于通过过滤大量的非格式化或半格式化的文本资料,使用自然语言处理技术中的浅层分析手段,捕捉文本中有用的信息并填写到信息槽中,经过后处理(如解决共指成分,消除重复信息等)过程,将难以用人力全部阅读和分析的自然语言文本中那些对于解决特定问题的无效内容过滤掉,然后将有用内容转换成容易用人工或机器进行分析的格式化数据。情报分析(informationanalysis)是指对一个特定领域的大量信息进行采集、选择、评价、分析和综合,或者为了某一特定任务对有关信息进行收集、分析和综合,使之成为对解决相关问题有用的情报的过程。也是一种以信息为研究对象,以情报学的方法和各种分析方法为手段,以解决特定理论问题或现实问题为目的的一类研究工作。选题情报分析课题的来源通常有三个方面,即上级机关下达的指令性课题,一般用户委托的课题,情报研究机构自选的课题。选题是情报分析过程中非常重要的环节,对最终结果影响很大。有一个好的选题可能意味着成功了50%。英国著名科学家J.D.贝尔纳说过:“课题的形成和选择,无论是作为外部的经济技术要求,还是作为科学本身的要求,都是科学研究工作中最复杂的一个阶段。一般来说,提出问题比解决问题更困难。”因此,选题一定要充分考虑其理论意义或现实意义如何,是否符合现实需要或长远需要,考虑用户的需要还要考虑可行性。情报分析研究工作的步骤开题报告的审查论证开题报告要清晰地阐述选题的背景、目的、意义、研究内容和重点、研究方案、研究条件、工作计划和进度、研究力量配备、经费预算等方面的内容。一般来说,只有符合下列条件:研究意义重要,目的明确,研究方案科学,实践上可行,经济上合理,选题才能得到确认。情报分析研究工作的步骤信息收集和整理信息是情报分析的基础。要全面地收集各种有关的信息和资料。收集的基

文档评论(0)

SYWL2019 + 关注
官方认证
文档贡献者

权威、专业、丰富

认证主体四川尚阅网络信息科技有限公司
IP属地四川
统一社会信用代码/组织机构代码
91510100MA6716HC2Y

1亿VIP精品文档

相关文档