Python数据分析与应用题库.docx

  1. 1、本文档共59页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

Python数据分析与应用题库

以下nltk模块中,可以对句子实现分词操作的是〔〕。[单项选择题]*

A

A、nltk.corpus

B、nltk.tokenize(正确答案)C、nltk.stem

D、nltk.tag

答案解析:暂无解析

以下函数中,用于翻开NLTK下载器的是〔〕。[单项选择题]*

A

A、download(正确答案)B、load

C、open

D、install

答案解析:暂无解析

以下选项中,NLTK用来标记形容词的是〔〕。[单项选择题]*

A

A、JJ(正确答案)B、RB

C、CC

D、DT

答案解析:暂无解析

关于词性归一化的说法中,以下描述正确的选项是〔〕。[单项选择题]*

A

A、词干提取和词形复原最终都会得到词根

B

B、词干提取能够捕获基于词根的标准单词形式

C、词形复原需要删除不影响词性的词缀得到词干

D、词形复原能够捕获基于词根的标准单词形式(正确答案)

答案解析:暂无解析

以下选项中,用于掌握jieba.cut分词模式的是〔〕。[单项选择题]*

A

A、dataB、HMM

C、is_all

D、cut_all(正确答案)

答案解析:jieba.cut函数共接收三个参数,其中第一个为需要分词的字符串,

cut_all参数用来掌握是否承受全模式,HMM参数用来掌握是否使用HMM模型。

以下方法中,用于返回消灭相对较频繁的单词的是〔〕。[单项选择题]*

A

A、word_tokenizeB、pos_tag

C、most_common(正确答案)

D、cosine_distance

答案解析:word_tokenize函数基于空格或标点对文本进展分词;pos_tag函数用

于给单词标注词性;cosine_distance函数用于求两个向量的夹角余弦值。

以下选项中,用于标注词语词性的模块是〔〕。[单项选择题]*

A

A、nltk.corpusB、nltk.tokenizeC、nltk.stem

D、nltk.tag(正确答案)

答案解析:暂无解析

以下分词模式中,可以将句子中全部成词词语都扫描出来的是〔〕。[单项选择题]*

A

A、准确模式

B、全模式(正确答案)C、搜寻引擎模式

D、模糊搜寻模式

答案解析:暂无解析

假设期望复原单词的根本形式,则需要使用import语句导入哪个模块?〔〕[单项选择题]*

A

A、nltk.corpusB、nltk.tokenize

C、nltk.stem(正确答案)

D、nltk.tag

答案解析:暂无解析

关于文本预处理的过程,以下描述错误的选项是〔〕。[单项选择题]*

A

A、文本分词是预处理过程中必不行少的一个操作

B、词干提取是一个很粗略的去除单词两端词缀的过程

C、词形复原是一个去除曲折的词缀且返回词典中包含的词的过程

D、文本中的每个单词都能够说明文本的特征(正确答案)

答案解析:文本中包含一些停用词,这些词是无法说明文本特征的。

通过date_range函数创立DatetimeIndex对象时,假设只是传入了开头日期,则还需要用〔〕参数指定产生多少个时间戳。[单项选择题]*

A

A、freq

B、end

C

C、periods(正确答案)

D、start

答案解析:暂无解析

请阅读下面一段程序:[单项选择题]*

运行上述程序,它最终输出的结果为

运行上述程序,它最终输出的结果为〔A〕。(正确答案)A、2023

B、2023

C、2023D、2023

答案解析:暂无解析

以下方法中,能够转换时期频率的是〔〕。[单项选择题]*

A

A、shiftB、rolling

C、asfreq(正确答案)

D、resample

答案解析:shift方法用于沿着时间轴方向将数据进展前移或后移;rolling方法用

于滑动窗口;resample是一个对常规时间序列数据重采样和频率转换的便捷的方法。

以下方法中,用来创立一个滑动窗口的是〔〕。[单项选择题]*

A

A、shift

B、rolling(正确答案)C、asfreq

D、resample

答案解析:暂无解析

请阅读下面一段程序:运行程序,它最终执行的结果为〔〕。[单项选择题]*

A

A、4

B、3(正确答案)C、2

D、1

答案解析:暂无解析

默认状况下,该对象中时间戳的频率为〔B〕。(正确答案)A、H

默认状况下,该对象中时间戳的频率为〔B〕。(正确答案)A、H

B、D

C、SD、T

答案解析:暂无解析

以下选项中,用来表示时间序列中的频率为每周六的是〔〕,[单项选择题]*

A

A、WOM-2MONB、W-FRI

C、W-SUN

D、W-SAT(正确答案)

答案解析:暂无解

文档评论(0)

写作定制、方案定制 + 关注
官方认证
服务提供商

专注地铁、铁路、市政领域安全管理资料的定制、修改及润色,本人已有7年专业领域工作经验,可承接安全方案、安全培训、安全交底、贯标外审、公路一级达标审核及安全生产许可证延期资料编制等工作,欢迎大家咨询~

认证主体天津析木信息咨询有限公司
IP属地天津
统一社会信用代码/组织机构代码
91120102MADGNL0R92

1亿VIP精品文档

相关文档