- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2.网络信息收集的工具
(1)搜索引擎
搜索引擎是对互联网信息资源进行搜索整理和分类,并储存在网络数据库中供用户查询的系统。搜索引擎是提供给用户进行关键词、词组或自然语言检索的工具,按其工作方式可分为(Full Text Search Engine)、目录索引类搜索引擎(Search Index/Directory)和元搜索引擎(Meta Search Engine)。
① 全文搜索引擎是通过从互联网上提取的各个网站的信息(以网页文字为主)而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户,如Baidu、Google等。全文搜索引擎对网页中的每一个词(即关键词)进行索引,建立索引数据库,当用户查找某个关键词的时候,所有在页面内容中包含了该关键词的网页都将作为搜索结果被搜出来,在经过复杂的算法进行排序后,这些结果将按照与搜索关键词的相关度高低,依次排列。
② 目录搜索引擎是以人工方式或半自动方式搜集信息,由编辑员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中。优点是信息准确、导航质量高;缺点是需要人工介入、维护量大、信息量少、信息更新不及时。目录搜索引擎虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已。用户完全可以不用进行关键词查询,仅靠分类目录也可找到需要的信息,如搜狐、新浪、网易搜索等。
③ 元搜索引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。著名的元搜索引擎主要有 InfoSpace、 Dogpile、 Vivisimo等,中文元搜索引擎主要有搜魅网(someta)、马虎聚搜、比比猫(bbmao)、觅搜(MetaSoo)等。在搜索结果排列方面,有的直接按来源引擎排列搜索结果,如Dogpile,有的则按自定的规则将结果重新排列组合,如Vivisimo。
此外,还有一些其他类型的搜索引擎,如垂直搜索引擎,它是针对某个行业的 专业搜索引擎,是搜索引擎的细分和延伸。它通过对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。因信息相对集中,这种搜索方式查找速度快,查准率较高。与综合性搜索引擎相比,垂直搜索引擎可以实现针对特定领域、特定人群、特定需求的专业化搜索,能提供给用户更专业、更具体和更深入的信息和服务,能够解决各个行业的特殊性搜索查询需求。
(2)信息采集软件
由于网络信息内容庞杂且无序混乱,当需要采集大量信息时,紧靠人工采集,速度慢且又容易漏掉重要的内容,因此,通过信息采集系统和软件进行网站内容采集可以提高信息收集的效率和准确性。网络信息采集系统以网络信息挖掘引擎为基础构建而成,它可以在最短的时间内,帮助用户把新的信息从不同的网站上采集下来,并在进行分类和统一格式后,再将信息及时发布到自己的站点上,从而提高了信息的及时性,减少了工作量。常见的信息采集软件有火车采集器、网络神采等。
(3)网络信息定制
看一看:行业电子商务网站发展情况信息定制是互联网获取信息的方式之一,用户通过定制网站或订阅网站来关注信息源(包括普通网页、RSS输出、关键词等)的最新动态结果。用户可以通过在线浏览、邮件订阅甚至手机短信等多种方式获取、接收最新结果。信息定制具有省时、高效、精准等优点。信息定制主要有
看一看:
行业电子商务网站发展情况
① RSS订阅。RSS(Really Simple Syndication,聚合内容)是在线共享内容的一种简易方式。通常在时效性比较强的新闻内容上使用RSS订阅能更快速获取信息,网站提供RSS输出,有利于让用户获取网站内容的最新更新。
② 定制网站。用户可以订阅各类网页(包括无RSS的普通网页)、关键词、特色订阅等,可进行关键词过滤。接收方式主要有在线浏览、邮箱或手机接收等。
③ 邮箱订阅。用户通过电子邮箱附带的阅读器进行订阅,使用便捷。邮箱订阅一般只能订阅含有RSS输出的网页。
您可能关注的文档
- 软件开发与项目管理-3期(KC012) 单元案例_问卷调查系统模块设计 单元案例_问卷调查系统模块设计.doc
- 包装技术与应用 集合包装概述 已有资源4-4-1 集合包装概述.ppt
- 包装技术与应用 金属食品罐(午餐肉)的包装工艺 已知资源4-1-2金属食品罐(午餐肉)的包装工艺.ppt
- 包装技术与应用 捆扎工艺 已有资源5-2-2捆扎工艺.ppt
- 软装设计 家具选择与陈设布置 【Space ·base篇】——不同空间的家具选择与陈设.docx
- 包装技术与应用 无菌包装技术概述 已知资源2-1无菌包装技术概述.ppt
- 包装技术与应用 无菌瓶(玻璃、塑料)包装的工艺过程 已有资源2-5 无菌瓶(玻璃、塑料)包装的工艺过程.ppt
- 森林环境 空气温度的表示与特征 3.1 授课计划.docx
- 包装结构与模切版设计 包装结构与模切版设计 2-14lh-1-1.pptx
- 商品信息采集与处理 商品信息采集与处理 练习题-居中构图法.doc
- 商业银行综合柜台业务 代理缴费业务操作处理 代理缴费业务引发的经济纠纷.doc
- 包装结构与模切版设计 翻盖式盒盖设计 1-5-6-2 翻盖式盒盖设计.ppt
- 商业银行综合柜台业务 电话银行 有效的银行转账业务营销.doc
- 包装结构与模切版设计 盒型打样机文件导入与设置 3-4-3-2 盒型打样机文件导入与设置.ppt
- 商业银行综合柜台业务 个人网上银行 半途而废的电话客服.doc
- 包装结构与模切版设计 情境大课业展示 1-11-1-4.ppt
- 商业银行综合柜台业务 活期储蓄柜面业务—开户 活期储蓄开户.docx
- 包装结构与模切版设计 情境大课业展示 1-11作业13.pptx
- 商业银行综合柜台业务 基金业务认(申)购 用假身份证购买基金引发的纠纷.doc
- 商业银行综合柜台业务 群体性突发事件 地震中的银行.doc
最近下载
- 抗日战争暨世界反法西斯战争胜利80周年PPT课件.pptx VIP
- 2024金华市金婺资源开发集团有限公司招聘17人笔试备考试题及答案解析.docx VIP
- 小学体育教学课件:跳绳课件.pptx
- 浙教版初中数学八年级上册第二章《特殊三角形》单元测试卷(含答案解析)(标准困难).docx VIP
- 浙江金华市金婺资源开发有限公司招聘笔试题库2022.pdf VIP
- 入院和出院护理.ppt VIP
- 研发人员职称评定与晋升管理办法.doc VIP
- YDT5178-2017 通信管道人孔和手孔图集.docx VIP
- 部编版七上全册古文注释、翻译、简答.pdf VIP
- 厂房出租合同正规版范本(2025年最新版)5篇.docx
文档评论(0)