- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
第二章习题及解答
1.简述网络信息资源的特点。
(1)分散性分布;
(2)共享性与开放性;
(3)数字化存储;
(4)网络化传输。
2.试比较全文搜索引擎、分类检索、元搜索引擎三种搜索引擎的不同之处。
全文搜索引擎是目前主流的搜索引擎,有计算机索引程序在互联网上自动检索网站网页,
建立起数据库,收录网页较多,用户按搜索词进行检索,返回排序的结果。以谷歌、百度、
必应等为代表。
分类检索,将人工搜集或用户提交的网站网页内容,将其网址分配到相关分类主题目录,
形成分类树形结构索引。用户不需用关键词检索,只要根据网站提供的主题分类目录,层层
点击进入,便可查到所需的网络信息资源。典型代表有Yahoo、新浪分类目录搜索、淘宝网
的类目等。分类检索用于目标模糊、主题较宽泛、某专业网站或网页的查找,要求查准时选
用;
元搜索引擎不是一种独立的搜索引擎,没有自己的计算机索引程序和索引数据库,是架
构在许多其他搜索引擎之上的搜索引擎。在接受用户查询请求时,可以同时在其他多个搜索
引擎中进行搜索,并将其他搜索引擎的检索结果经过处理后返回给用户。
3.简述搜索引擎的工作原理。
搜索引擎的基本工作原理包括如下三个过程:首先,抓取,在互联网中发现、搜集网页
信息;第二,建立索引,对信息进行提取和组织建立索引库;第三,搜索词处理和排序,由
检索器根据用户输入的查询关键字,在索引库中快速检出文档,进行文档与查询的相关度评
价,对将要输出的结果进行排序,并将查询结果返回给用户。
4.简述常用的关键词高级检索功能。
常用的关键词高级检索功能应用包括:使用检索表达式搜索、使用高级搜索页、元词搜
索。
使用检索表达式搜索分别有空格、双引号、使用加号、通配符、使用布尔检索等。
有时我们为了限制搜索范围、搜索时间、过滤关键字等,需要用到高级搜索页。
大多数搜索引擎都支持“元词”(metawords)功能。依据这类功能,用户把元词放在
关键词的前面,这样就可以告诉搜索引擎你想要检索的内容具有哪些明确的特征。
5.简述基于大数据信息检索的特点。
基于大数据的信息检索具有以下特点:
智能化、个性化、可视化。
6.简述大数据的特征。
大数据的特征可用4V来概括:
第一,Volume(海量的数据规模);
第二,Variety(多样的数据类型);
第三,Value(价值密度低);
第四,Velocity(快速的数据流转)。
7.简述大数据的总体三层架构。
大数据的总体架构包括三层:数据存储、数据处理和数据分析。类型复杂和海量由数据
存储层解决,快速和时效性要求由数据处理层解决,价值由数据分析层解决。
8.数据分析主要关注的两个内容是什么?
数据分析主要关注两个内容:一是数据建模,在该数据模型下需要支持各种分析方法和
分析策略;二是根据业务目标和业务需求建立的KPI指标体系,对应指标体系的分析模型和
分析方法。解决这两个问题基本解决数据分析的问题。
9.简述数据挖掘。
数据挖掘是面对海量数据时对数据价值进行提炼的关键环节,它没有什么预先设定好的
主题,主要是在现有数据上面进行基于各种算法的计算,从而起到预测(Predict)的效果,
实现一些高级别数据分析的需求。比较典型算法有用于聚类的Kmeans、用于统计学习的SVM
和用于分类的NaiveBayes,主要使用的工具有Hadoop的Mahout等。
10.简述大数据思维。
大数据时代的变革绝不限于技术层面,本质上,它为我们观察世界提供了一种全新思维。
(1)从样本思维转向总体思维。在大数据时代,人们可以获得并分析更多的数据,而
不再依赖于采样。
(2)从精确思维转向容错思维。当拥有海量即时数据时,绝对的精准不再是追求的主
要目标,适当忽略微观层面上的精确度,容许一定程度的错误与混杂。
(3)从因果思维转向相关思维。在大数据时代,人们可以通过大数据技术挖掘出事物
之间隐蔽的相关关系,获得更多的认知与洞见。
11.简述大数据的价值。
(1)对大量消费者提供产品或服务的企业可以利用大数据进行精准营销;做小而美模
式的中小微企业可以利用大数据做服务转型。
(2)
您可能关注的文档
- 管理信息系统实验报告.pdf
- 管件连接形式中英文对照表.pdf
- 简述营销案例分析的流程.pdf
- 第十三届“挑战杯”全国大学生课外学术科技作品竞赛哲学社会科学类参赛作品参考题.pdf
- 第二季度护理三基试卷.pdf
- 第九单元 中华人民共和国成立和社会主义革命与建设全章教案.pdf
- 第5章 科学认识的形成和科学理论的创立.pdf
- 第2节细胞器系统内的分工合作教学设计与点评.pdf
- 第13章电路初探 苏科版物理九年级上册.docx
- 第17课《盼》配套练习(基础+阅读)-部编版六年级上册.docx
- 第18讲 第17课 西晋的短暂统一和北方各族的内迁.docx
- 第15讲 第14课 沟通中外文明的“丝绸之路”.docx
- 第13课时 中东 欧洲西部.doc
- 第17讲 第16 课三国鼎立.docx
- 第17讲 第16课 三国鼎立 带解析.docx
- 2024_2025年新教材高中历史课时检测9近代西方的法律与教化含解析新人教版选择性必修1.doc
- 2024_2025学年高二数学下学期期末备考试卷文含解析.docx
- 山西版2024高考政治一轮复习第二单元生产劳动与经营第5课时企业与劳动者教案.docx
- 第16讲 第15课 两汉的科技和文化 带解析.docx
- 第13课 宋元时期的科技与中外交通.docx
文档评论(0)