关键词的选取培训教案.ppt

  1. 1、本文档共24页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
关键词的选取培训教案

关键词的选取 1. 关键词的含义 关键词:指从文献的标题、文摘及正文中抽取的对表达文献主题起关键作用且具有检索意义的词语。 例如: 1)“图书馆自动化系统的设计” 关键词为:图书馆、自动化系统、设计 2)你在“民间借贷风险防范研究”一文中把“信用管理”作为重点论述,则关键词就可以选择:“民间借贷”、“风险防范”、“信用管理”等三个关键词。 2. 关键词的数量 关键词选取的数量取决于文献论述的内容,如果论文论述的主题较多,则选取的关键词较多,反之则少。 选取3-5个关键词为宜。一般不超过7个。 例如:“论数字图书馆的组织模式” 关键词:数字图书馆、组织模式 3. 关键词词类的选择 关键词主要选择:名词、动名词、名词化的词组。 冠词、介词、连词、助动词、某些形容词不作关键词。 一些动词和形容词在它们构成名词性词组时才能作为关键词。 动词只有在它们名词化或的确对表达文献主题具有检索意义时才选作关键词。 没有检索意义的通用词也不作关键词。如:分析、报告、方法等。 例如:“计算机在建筑设计和建筑工程中的应用” 关键词:计算机、建筑设计、建筑工程 应用则没有检索意义,不能作为关键词。 4. 关键词选取的范围 关键词选取的范围不限于文献的标题(篇名),也可以从文献的文摘和正文中选取。 例如:“论搜索引擎的原理和检索特性”一文,由于文中论述的内容涉及Internet信息检索的发展、搜索引擎的服务类型和工作原理、搜索引擎的检索特性以及Web检索与传统联机检索的关系等内容,则可以根据论文的主题内容,选取“搜索引擎”、“信息检索”、“联机检索”、“万维网”、“因特网”作为关键词。 5. 词组的判断与选择 对于固定搭配且具有特定含义的词组和科技术语,不宜拆分开来,而应以词组和科技术语作为关键词。(这样可以减少关键词的数量,且能更好地表达文献的主题,不致产生歧义和误解。) 例如:“浅谈信息高速公路与资源共享” 关键词:信息高速公路、资源共享 (而非:信息、高速公路、资源、共享) 分析下面题目的关键词 1. 情报检索系统:从布尔逻辑到向量空间 2. UML在学生管理信息系统分析中的应用 选择论文关键词应注意事项 1)不能反映你所写的论文特点的词不要选。例如:“策略”、“研究”、“管理”、“分析”、“探讨”等,这些词一般论文题目都有,太一般化。 2)“词”的特征不明显的用语不能选。例如,“我国”、“我省”、“东北”、“加强”等。 3)关键词之间不要重复。例如:“投资风险”和“风险防范”,两个词中都有“风险”,明显重复。可以把“投资风险”中的“风险”去掉,或者保留“投资风险”,去掉“风险防范”,改选其他关键词。 4)不要把句子写成关键词。例如“强化金融监管”,这明显是一句话,而不是词。 在不影响词义的前提下,关键词应该尽量精炼,选择最小化的词单位。 搜索引擎关键词(查询词)的选取 就是选择合适的查询词。选择查询词是一种经验积累,在一定程度上也有章可循 。 1. 表述准确 2. 查询词的主题关联与简练 3.根据网页特征选择查询词 1.表述准确 一类常见的表述不准确情况是,脑袋里想着一回事,搜索框里输入的是另一回事。 例如,要查找2010年国内十大新闻,查询词可以是“2010年国内十大新闻”;但如果把查询词换成“2010年国内十大事件”,搜索结果就没有能满足需求的了。 另一类典型的表述不准确,是查询词中包含错别字。 例如,要查找林心如的写真图片,用“林心如 影视”,当然是没什么问题;但如果写错了字,变成“林心茹 影视”,搜索结果质量就差得远了。 2.查询词的主题关联与简练 目前的搜索引擎并不能很好的处理自然语言。因此,在提交搜索请求时,您最好把自己的想法,提炼成简单的,而且与希望找到的信息内容主题关联的查询词。 例如:某三年级小学生,想查一些关于时间的名人名言。 他的查询词是“小学三年级关于时间的名人名言”。 绝大多数名人名言,并不规定是针对几年级的,因此,“小学三年级”事实上和主题无关,会使得搜索引擎丢掉大量不含“小学三年级”,但非常有价值的信息;“关于”也是一个与名人名言本身没有关系的词,多一个这样的词,又会减少很多有价值信息;“时间的名人名言”,其中的“的”也不是一个必要的词,会对搜索结果产生干扰;“名人名言”,名言通常就是名人留下来的,在名言前加上名人,是一种不必要的重复。 因此,最好的查询词,应该是“时间名言”。 试着找出下述查询词的问题,并想出更好的能满足搜索需求的查询词: 1. 所得税会计处理问题探讨 2. 周星驰个人档案和所拍的电影 3.根据网页特征选择查询词 很多类型的网页都有某种相似的特征。经常搜索、总结各类网页的特征现象,并应用在查询词的

文档评论(0)

phljianjian + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档