网络信息采集详解.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
LOGO Company LOGO 网络信息采集 信息获取的一般步骤 网络信息资源与信息采集工具 数据的整理 常用的开放获取资源 研究背景 内容构架 研究背景 我们经常会遇到这样的问题: 1 为什么找不到所需要的信息? 2 为什么查找信息的过程要比别人长? 3 怎么将找到的信息很好地运用,最终解决信息问题? 问题1 问题2 问题3 需要了解一些相关机构发布信息的网站,获得准确的专业信息; 学会使用网络数据库资源获取期刊文摘及全文信息、学术论文等。 第三部分 对文献的内容进行深入分析和挖掘,真正把握信息点及其他人的研究成果,形成自己对问题的认识。 第四部分 培养一套解决信息问题的思考方式,依据步骤逐层深入。 第二部分 信息获取的一般步骤 Level 1 Level 2 Level 3 Level 4 Level 5 界定问题 选择信息源 制定策略并实施检索 评价信息 分析和利用信息 界定问题 考虑的问题:自己是否完全理解待解决问题的相关概念含义?需要查找哪些方面的信息?需要第一手即时消息还是经过加工的消息?问题解决后应该是一个什么样的成果类型?最终,实现对问题的深入思考,完成问题的界定。 包括:分析研究问题、建立背景知识、拟定主题概念。 分析研究问题 研究问题 在某情况下,物流公司对货物处理速度情况的研究 研究目标 形成调研报告供学者参考 时间范围 近10年 地域范围 国内、外 背景/事件 货物处理速度对物流公司运营状况的影响 研究问题分析—以“在某情况下,物流公司对货物处理速度情况的研究”为例 建立背景知识 阅读与研究主题相关的概览性资料,是建立背景知识的最佳渠道。概览性资料通常出现在三次文献中,如百科全书、字词典及年鉴等参考资源中。通过阅读这些资源,可以加深对研究问题的理解,明确检索目标。同时对问题涉及的名词术语进行记录,了解清楚该研究对象的学名、俗名、商业名、同义词等,特别作用非母语检索工具之前,这些名词术语花样繁多的英文表达更是不能疏漏的。 信息问题 在哪种情况下 研究范围 影响货物处理速度的因素 包含的主题概念 运输工具、管理工具、天气因素(百度查得) 拟定主题概念 以“交通工具不同情况下,物流公司对货物处理速度情况的研究”为例 研究问题 不同交通工具下,货物处理速度的研究 主要概念 不同交通工具 上位词 交通方式的选择、路线的规划、整体策略的确定 同义词 海运、路运、空运、管道运输、联合运输 相关词 环境保护、节约成本 其他步骤 2 选择信息源。针对“在某情况下,物流公司对货物处理速度情况的研究”这一问题,需要考虑可能存在哪些信息源,哪些信息源是可获得的,在这些可获得的资源中,哪些是比较易得而有意义的。 3 制定策略并实施检索。在开始检索之前没有一个确定的检索策略,就可能很快在消息中“迷失”。这时如果能够利用布尔逻辑连接符将检索词组配成查询语句,并结合各个信息源的特点灵活实施检索,将极大地提高检索效率。 4 评价信息。针对不同信息源进行检索以后,取得的文献信息数量可能相当庞大,内容也有相互重复甚至冲突的地方。这就需要一定的评价方法对信息进行筛选,找到那些来源可靠、内容相关且详尽的文献,删除错误、过时、不相关的信息。 5 分析和利用信息。此时选用相关的工具将检索结果有效组织,会极大地减少工作量。同时进一步通过阅读确定:哪些信息切合需要,哪些信息内容之间存在冲突,需要进一步考察,并依据相关规范正确引用文献资源,最终形成文字性的研究成果。 网络信息资源与信息采集工具 网络信息资源 广义的网络信息源指对各种信息进行分类、汇总、加工、组织,并建立起相互关联的有序结构,由信息内容、信息处理和信息传输三者结合而成。 狭义的网络信息源指用户可以在网上直接取用的无数个信息源的集合。 网络检索工具: 在internet上提供信息检索服务的工具,其检索对象是存在于internet空间中的各类信息资源。 网络信息的采集 正如前述,在浩如烟海的网络上搜寻信息,需要用户了解各种信息源,掌握各种网络信息检索工具,学会信息采集的方法技能,才能将网上的丰富资源为己所用。网络信息的采集工具,或称检索工具,一般泛指面相互联网信息检索、在因特网上提供网页信息资源检索和网站导航服务的站点,具有网络导航的功能,并提供其他相关服务。网络信息采集工具可以大致分为搜索引擎、门户网站和搜索软件、专题型检索工具。 个人信息检索 地图信息检索 BBS检索 博客检索 搜索引擎 专题型检索工具 微博检索工具 维基搜索 RSS检索 FTP资源检索 目录式搜索引擎 机器人搜索引擎 元搜索引擎 详细介绍 目录式搜索引擎 目录式搜索引擎因为有人的参与,信息查询较为精确,导航质量高。当检索一个范围较广的题目,并希望浏览一下与该题目相关的、被推荐

文档评论(0)

bodkd + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档