Python快乐编程——数据分析与实战 习题答案(清华).docx

Python快乐编程——数据分析与实战 习题答案(清华).docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Python快乐编程——数据分析与实战 习题答案 第三章 一: 1. ndarray数据类型 矩阵 2. dtype size shape itemszie ndim 3. mat matrix 4. 排序 去重 使用内置函数进行处理 二: 1. B 2. B 3. AC 4. D 三: 1. 重置数组的形状 2. 创建一个全部参数为1的数组 第四章-Pandas的基本操作 一, 1. A 2. D 3. B 4. CD 二, 1. read_sql_table read_sql_query read_sql 2. dropna fillna isnull notnull 3. reindex 三, 1. Frame和Series 2. (1) 使用unique进行唯一性判断 (2)使用value_count进行次数统计 (3)使用isin进行成员资格检查 第五章 一: A A C A 二: 步骤1:绘制画布 步骤2:添加子图并绘制图形 步骤3:规定x,y轴及相关标签 步骤4:保存图片或者显示 三: 略 第六章 参考答案: 一: 1. Timestamp, Period, Timedelta,DatetimeIndex,PeriodtimeIndex, TimedeltaIndex 2. to_timestamp 3. 获取对应的日期的星期名(如Wonday) 4. floor, ceil, round 二: 1.D 2.A 3.A 4.A 5.B 三: 略 四: 更正结果 1. import pandas as pd time_index = pd.date_range(1/1/20,periods = 10 , freq =1h30min) print(time_index) 2. import pandas as pd rng = pd.period_range(1/1/2000, 6/30/2000, freq = M) print(rng) 3. p = pd.Period(2019, freq = A-DEC) time = p.asfreq(D) # 年初 print(time) 第七章 一. 1. how 字符串类型 inner 2. concat 3. corr method 4. 量纲 [0,1] 或者[-1,1] 5. 最大-最小标准化方法、Z-score标准化方法、小数定标标准化方法。 二. 1. D 2. C 3. D 4. A 5. A 三. 1. 错 2. 对 3. 错 4. 对 四. 1 .箱型图 和 基于3 σ方法 箱型图的 优点:直观、方便 缺点:数据量比较大时不能直接观察确切的值 3 σ方法: 优点:能够将值的分离出来 缺点:数据源只能是服从正态分布 五. 略 第八章 一. 填空题 1. 文本处理常用的Python库有____和____。 2. jieba库支持____、____、____三种分词模式。 3. NLTK库由____、____、开发而成。 4. 文本相似度分析可以使用____库和____库。 5. 文本情感分析又被称为____、和____、,指的是带有情感色彩的主观性文本进行____、____、____、和____的过程 1. NLTK\jieba 2. 精确模式 全模式 搜索引擎模式 3. Steven Bird Edward Lope 4. NLTK gensim 5. 倾向性分析 意见挖掘 分析 处理 归纳 推理 二. 选择题 1. 下列关于jieba 说法正确的是( ) A. jieba分词包含4种工作模式 B. jieba分词可以用于英文文本 C. jieba分词的默认模式为精确模式 D. jieba分词可以自定义停止词词典 2. 下列关于NLTK说法正确的是( ) A. NLTK可以用于若干种语言 B. NLTK不可用于中文文本分析 C. NLTK词性标注CC表示连击词 D. NLTK免费开源 3. 下列关于文本相似度分析说法不正确的是( ) A. gensim使用词袋模型进行文本分析 B. token2id值是词典中词语的序号 C. 文本相似度计算的对象是词频向量 D. 余弦相似度计算能表示所有文本内容的比较 4. 下列关于情感分析说法不正确的是( ) A. 情感分词主要使用train函数训练模型 B. 词典分词不适合大量的文章 C. 朴素贝叶斯分析不适合小量的文章 D. 情感分析有又称为意向挖掘 1-4: C C D C 三. 判断题 1. NLTK分词只能用于英文。( ) 2. jibe分词只能用于中文。( ) 3. 停止词对文本分析没有任何帮助。 ( ) 4. jieba分词在词干提取时可以使用并

文档评论(0)

balala11 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档