第二章习题答案与解答.pdfVIP

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第二章习题及解答

1.简述网络信息资源的特点。

(1)分散性分布;

(2)共享性与开放性;

(3)数字化存储;

(4)网络化传输。

2.试比较全文搜索引擎、分类检索、元搜索引擎三种搜索引擎的不同之处。

全文搜索引擎是目前主流的搜索引擎,有计算机索引程序在互联网上自动检索网站网页,

建立起数据库,收录网页较多,用户按搜索词进行检索,返回排序的结果。以谷歌、百度、

必应等为代表。

分类检索,将人工搜集或用户提交的网站网页内容,将其网址分配到相关分类主题目录,

形成分类树形结构索引。用户不需用关键词检索,只要根据网站提供的主题分类目录,层层

点击进入,便可查到所需的网络信息资源。典型代表有Yahoo、新浪分类目录搜索、淘宝网

的类目等。分类检索用于目标模糊、主题较宽泛、某专业网站或网页的查找,要求查准时选

用;

元搜索引擎不是一种独立的搜索引擎,没有自己的计算机索引程序和索引数据库,是架

构在许多其他搜索引擎之上的搜索引擎。在接受用户查询请求时,可以同时在其他多个搜索

引擎中进行搜索,并将其他搜索引擎的检索结果经过处理后返回给用户。

3.简述搜索引擎的工作原理。

搜索引擎的基本工作原理包括如下三个过程:首先,抓取,在互联网中发现、搜集网页

信息;第二,建立索引,对信息进行提取和组织建立索引库;第三,搜索词处理和排序,由

检索器根据用户输入的查询关键字,在索引库中快速检出文档,进行文档与查询的相关度评

价,对将要输出的结果进行排序,并将查询结果返回给用户。

4.简述常用的关键词高级检索功能。

常用的关键词高级检索功能应用包括:使用检索表达式搜索、使用高级搜索页、元词搜

索。

使用检索表达式搜索分别有空格、双引号、使用加号、通配符、使用布尔检索等。

有时我们为了限制搜索范围、搜索时间、过滤关键字等,需要用到高级搜索页。

大多数搜索引擎都支持“元词”(metawords)功能。依据这类功能,用户把元词放在

关键词的前面,这样就可以告诉搜索引擎你想要检索的内容具有哪些明确的特征。

5.简述基于大数据信息检索的特点。

基于大数据的信息检索具有以下特点:

智能化、个性化、可视化。

6.简述大数据的特征。

大数据的特征可用4V来概括:

第一,Volume(海量的数据规模);

第二,Variety(多样的数据类型);

第三,Value(价值密度低);

第四,Velocity(快速的数据流转)。

7.简述大数据的总体三层架构。

大数据的总体架构包括三层:数据存储、数据处理和数据分析。类型复杂和海量由数据

存储层解决,快速和时效性要求由数据处理层解决,价值由数据分析层解决。

8.数据分析主要关注的两个内容是什么?

数据分析主要关注两个内容:一是数据建模,在该数据模型下需要支持各种分析方法和

分析策略;二是根据业务目标和业务需求建立的KPI指标体系,对应指标体系的分析模型和

分析方法。解决这两个问题基本解决数据分析的问题。

9.简述数据挖掘。

数据挖掘是面对海量数据时对数据价值进行提炼的关键环节,它没有什么预先设定好的

主题,主要是在现有数据上面进行基于各种算法的计算,从而起到预测(Predict)的效果,

实现一些高级别数据分析的需求。比较典型算法有用于聚类的Kmeans、用于统计学习的SVM

和用于分类的NaiveBayes,主要使用的工具有Hadoop的Mahout等。

10.简述大数据思维。

大数据时代的变革绝不限于技术层面,本质上,它为我们观察世界提供了一种全新思维。

(1)从样本思维转向总体思维。在大数据时代,人们可以获得并分析更多的数据,而

不再依赖于采样。

(2)从精确思维转向容错思维。当拥有海量即时数据时,绝对的精准不再是追求的主

要目标,适当忽略微观层面上的精确度,容许一定程度的错误与混杂。

(3)从因果思维转向相关思维。在大数据时代,人们可以通过大数据技术挖掘出事物

之间隐蔽的相关关系,获得更多的认知与洞见。

11.简述大数据的价值。

(1)对大量消费者提供产品或服务的企业可以利用大数据进行精准营销;做小而美模

式的中小微企业可以利用大数据做服务转型。

(2)

文档评论(0)

195****1552 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档