Python快乐编程——数据分析与实战习题答案（清华）.docx

下载文档

141
0
约2.33千字
约 6页
2022-08-18 发布于山东
举报
版权申诉
保障服务

Python快乐编程——数据分析与实战习题答案（清华）.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

Python快乐编程——数据分析与实战习题答案第三章一： 1. ndarray数据类型矩阵 2. dtype size shape itemszie ndim 3. mat matrix 4. 排序去重使用内置函数进行处理二： 1. B 2. B 3. AC 4. D 三： 1. 重置数组的形状 2. 创建一个全部参数为1的数组第四章-Pandas的基本操作一, 1. A 2. D 3. B 4. CD 二， 1. read_sql_table read_sql_query read_sql 2. dropna fillna isnull notnull 3. reindex 三， 1. Frame和Series 2. (1) 使用unique进行唯一性判断（2）使用value_count进行次数统计（3）使用isin进行成员资格检查第五章一： A A C A 二：步骤1:绘制画布步骤2:添加子图并绘制图形步骤3:规定x，y轴及相关标签步骤4:保存图片或者显示三：略第六章参考答案：一： 1. Timestamp, Period, Timedelta,DatetimeIndex,PeriodtimeIndex, TimedeltaIndex 2. to_timestamp 3. 获取对应的日期的星期名（如Wonday） 4. floor, ceil, round 二： 1.D 2.A 3.A 4.A 5.B 三：略四：更正结果 1. import pandas as pd time_index = pd.date_range(1/1/20,periods = 10 , freq =1h30min) print(time_index) 2. import pandas as pd rng = pd.period_range(1/1/2000, 6/30/2000, freq = M) print(rng) 3. p = pd.Period(2019, freq = A-DEC) time = p.asfreq(D) # 年初 print(time) 第七章一. 1. how 字符串类型 inner 2. concat 3. corr method 4. 量纲 [0,1] 或者[-1,1] 5. 最大-最小标准化方法、Z-score标准化方法、小数定标标准化方法。二. 1. D 2. C 3. D 4. A 5. A 三. 1. 错 2. 对 3. 错 4. 对四. 1 .箱型图和基于3 σ方法箱型图的优点：直观、方便缺点：数据量比较大时不能直接观察确切的值 3 σ方法：优点：能够将值的分离出来缺点：数据源只能是服从正态分布五. 略第八章一. 填空题 1. 文本处理常用的Python库有____和____。 2. jieba库支持____、____、____三种分词模式。 3. NLTK库由____、____、开发而成。 4. 文本相似度分析可以使用____库和____库。 5. 文本情感分析又被称为____、和____、，指的是带有情感色彩的主观性文本进行____、____、____、和____的过程 1. NLTK\jieba 2. 精确模式全模式搜索引擎模式 3. Steven Bird Edward Lope 4. NLTK gensim 5. 倾向性分析意见挖掘分析处理归纳推理二. 选择题 1. 下列关于jieba 说法正确的是（） A. jieba分词包含4种工作模式 B. jieba分词可以用于英文文本 C. jieba分词的默认模式为精确模式 D. jieba分词可以自定义停止词词典 2. 下列关于NLTK说法正确的是（） A. NLTK可以用于若干种语言 B. NLTK不可用于中文文本分析 C. NLTK词性标注CC表示连击词 D. NLTK免费开源 3. 下列关于文本相似度分析说法不正确的是（） A. gensim使用词袋模型进行文本分析 B. token2id值是词典中词语的序号 C. 文本相似度计算的对象是词频向量 D. 余弦相似度计算能表示所有文本内容的比较 4. 下列关于情感分析说法不正确的是（） A. 情感分词主要使用train函数训练模型 B. 词典分词不适合大量的文章 C. 朴素贝叶斯分析不适合小量的文章 D. 情感分析有又称为意向挖掘 1-4: C C D C 三. 判断题 1. NLTK分词只能用于英文。（） 2. jibe分词只能用于中文。（） 3. 停止词对文本分析没有任何帮助。（） 4. jieba分词在词干提取时可以使用并

您可能关注的文档

文档评论（0）

balala11 + 关注: 实名认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

Python快乐编程——数据分析与实战习题答案（清华）.docx