- 1、本文档共59页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Python数据分析与应用题库
下列nltk模块中,可以对句子实现分词操作的是()。 [单选题] *
A、nltk.corpus
B、nltk.tokenize(正确答案)
C、nltk.stem
D、nltk.tag
答案解析:暂无解析
下列函数中,用于打开NLTK下载器的是()。 [单选题] *
A、download()(正确答案)
B、load()
C、open()
D、install()
答案解析:暂无解析
下列选项中,NLTK用来标记形容词的是()。 [单选题] *
A、JJ(正确答案)
B、RB
C、CC
D、DT
答案解析:暂无解析
关于词性归一化的说法中,下列描述正确的是()。 [单选题] *
A、词干提取和词形还原最终都会得到词根
B、词干提取能够捕捉基于词根的规范单词形式
C、词形还原需要删除不影响词性的词缀得到词干
D、词形还原能够捕捉基于词根的规范单词形式(正确答案)
答案解析:暂无解析
下列选项中,用于控制jieba.cut()分词模式的是()。 [单选题] *
A、data
B、HMM
C、is_all
D、cut_all(正确答案)
答案解析:jieba.cut()函数共接收三个参数,其中第一个为需要分词的字符串,cut_all参数用来控制是否采用全模式,HMM 参数用来控制是否使用 HMM 模型。
下列方法中,用于返回出现相对较频繁的单词的是()。 [单选题] *
A、word_tokenize()
B、pos_tag()
C、most_common()(正确答案)
D、cosine_distance()
答案解析:word_tokenize()函数基于空格或标点对文本进行分词;pos_tag()函数用于给单词标注词性;cosine_distance()函数用于求两个向量的夹角余弦值。
下列选项中,用于标注词语词性的模块是()。 [单选题] *
A、nltk.corpus
B、nltk.tokenize
C、nltk.stem
D、nltk.tag(正确答案)
答案解析:暂无解析
下列分词模式中,可以将句子中所有成词词语都扫描出来的是()。 [单选题] *
A、精确模式
B、全模式(正确答案)
C、搜索引擎模式
D、模糊搜索模式
答案解析:暂无解析
如果希望还原单词的基本形式,则需要使用import语句导入哪个模块?() [单选题] *
A、nltk.corpus
B、nltk.tokenize
C、nltk.stem(正确答案)
D、nltk.tag
答案解析:暂无解析
关于文本预处理的过程,下列描述错误的是()。 [单选题] *
A、文本分词是预处理过程中必不可少的一个操作
B、词干提取是一个很粗略的去除单词两端词缀的过程
C、词形还原是一个去除曲折的词缀且返回词典中包含的词的过程
D、文本中的每个单词都能够表明文本的特征(正确答案)
答案解析:文本中包含一些停用词,这些词是无法表明文本特征的。
通过date_range()函数创建DatetimeIndex对象时,如果只是传入了开始日期,则还需要用()参数指定产生多少个时间戳。 [单选题] *
A、freq
B、end
C、periods(正确答案)
D、start
答案解析:暂无解析
请阅读下面一段程序: [单选题] *
运行上述程序,它最终输出的结果为(A)。(正确答案)
A、2015
B、2014
C、2013
D、2012
答案解析:暂无解析
下列方法中,能够转换时期频率的是()。 [单选题] *
A、shift()
B、rolling()
C、asfreq()(正确答案)
D、resample()
答案解析:shift()方法用于沿着时间轴方向将数据进行前移或后移;rolling()方法用于滑动窗口;resample()是一个对常规时间序列数据重新采样和频率转换的便捷的方法。
下列方法中,用来创建一个滑动窗口的是()。 [单选题] *
A、shift()
B、rolling()(正确答案)
C、asfreq()
D、resample()
答案解析:暂无解析
请阅读下面一段程序: 运行程序,它最终执行的结果为()。 [单选题] *
A、4
B、3(正确答案)
C、2
D、1
答案解析:暂无解析
创建一个DatetimeIndex对象的代码如下:pd.date_range(2018/08/10, 2018/08/15) [单选题] *
默认情况下,该对象中时间戳的频率为(B)。(正确答案)
A、H
B、D
C、S
D、T
答案解析:暂无解析
下列选项中,用来表示时间序列中的频率为每周六的是(), [单选题] *
A、WOM-2MON
B、W-FRI
C、W-SUN
D、W-SAT(正确答案)
答案解析:暂无解析
下列选项中,用来表示P
您可能关注的文档
- 【试卷一】Python一级考试练习题图文练习.doc
- C语言试题及答案.doc
- NCT-Python编程一级-模拟卷2(含答案.doc
- NCT-Python编程一级-模拟卷5(含答案优质.doc
- Python编程练习题60题-含答案.docx
- python二级模拟卷5图文word练习.doc
- python基础试题(含答案).docx
- Python开发阶段试题及答案(三).docx
- Python练习题1以及答案.docx
- Python练习题3以及答案.docx
- 四川省德阳市罗江中学2025届高三考前热身化学试卷含解析.doc
- 山东省枣庄现代实验学校2025届高三下学期第五次调研考试化学试题含解析.doc
- 吉林省长春市十一高中等九校教育联盟2025届高三一诊考试生物试卷含解析.doc
- 2025届江苏省盐城市伍佑中学高考仿真模拟化学试卷含解析.doc
- 2025届广西贺州中学高考冲刺押题(最后一卷)生物试卷含解析.doc
- 安徽省池州市贵池区2025届高三第一次模拟考试生物试卷含解析.doc
- 宁夏银川一中2025届高三(最后冲刺)化学试卷含解析.doc
- 广东省广州市增城区四校联考2025届高考压轴卷化学试卷含解析.doc
- 2025届邯郸市第一中学高考生物必刷试卷含解析.doc
- 2025届安徽省安庆市石化第一中学高考仿真卷化学试卷含解析.doc
文档评论(0)