大数据可视化技术与应用 习题及答案 第6章 文本数据可视化.docx

大数据可视化技术与应用 习题及答案 第6章 文本数据可视化.docx

  1. 1、本文档共2页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

单选题

TF-IDF指标是将TF和IDF()得到的,该指标综合考虑了一个词语在目标文本和其他文本中出现的频率。

相加B.相减C.相乘D.相除

以下哪项是关键词可视化的方法()

文档散B.主体河流C.文本流D.词语树

文本弧的特性之一是用一条()来表示一篇文章。

直线B.弧线C.虚线D.螺旋线

语义级使用()信息挖掘方法来支持信息的挖掘。

A.各类分词算法B.句法分析算法C.主题提取算法D.语义提取算法

以下哪个不是文本关系可视化的方法()

A.词语树 B.短语网络 C.星系视图 D.文档散

判断题

一个词语若在一个文本中出现频率较高,那么这个词语就是这个文本的关键词。()

一般来讲,标签云中关键词的权重越大,则其字体越大,颜色越鲜艳,透明度越低。()

在文本弧中,若词语只是在局部出现得比较频繁,则其靠近螺旋线分布。()

一个只处理单个静态页面的程序(比如下载某一个网页)是网络爬虫。()

短语网络包括节点和直线两种属性。()

填空题

关键词可视化常用的2种方法为和。

时序文本可视化的常用的3种流图分别为,和。

时序文本具有和。

文本可视化可分为:、、。

文本关系可视化的目的是。

答案:

单选题

1.TF-IDF指标是将TF和IDF(C)得到的,该指标综合考虑了一个词语在目标文本和其他文本中出现的频率。

相加B.相减C.相乘D.相除

2.以下哪项是关键词可视化的方法(A)

文档散B.主体河流C.文本流D.词语树

3.文本弧的特性之一是用一条(D)来表示一篇文章。

直线B.弧线C.虚线D.螺旋线

4.语义级使用(C)信息挖掘方法来支持信息的挖掘。

A.各类分词算法B.句法分析算法C.主题提取算法D.语义提取算法

5.以下哪个不是文本关系可视化的方法(D)

A.词语树 B.短语网络 C.星系视图 D.文档散

判断题

1.一个词语若在一个文本中出现频率较高,那么这个词语就是这个文本的关键词。(×)

2.一般来讲,标签云中关键词的权重越大,则其字体越大,颜色越鲜艳,透明度越低。(√)

3.在文本弧中,若词语只是在局部出现得比较频繁,则其靠近螺旋线分布。(√)

4.一个只处理单个静态页面的程序(比如下载某一个网页)是网络爬虫。(×)

5.短语网络包括节点和直线两种属性。(×)

填空题

1.关键词可视化常用的2种方法为标签云和文档散。

2.时序文本可视化的常用的3种流图分别为主体河流,文本流和故事流。

3.时序文本具有时间性和顺序性。

4.文本可视化可分为:文本内容的可视化、文本关系的可视化、文本多层面信息的可视化。

5.文本关系可视化的目的是呈现文本关系。

您可能关注的文档

文档评论(0)

xiaobao + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档