- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Python快乐编程——数据分析与实战 习题答案
第三章
一:
1. ndarray数据类型 矩阵
2. dtype size shape itemszie ndim
3. mat matrix
4. 排序 去重 使用内置函数进行处理
二:
1. B
2. B
3. AC
4. D
三:
1. 重置数组的形状
2. 创建一个全部参数为1的数组
第四章-Pandas的基本操作
一,
1. A
2. D
3. B
4. CD
二,
1.
read_sql_table
read_sql_query
read_sql
2. dropna fillna isnull notnull
3. reindex
三,
1. Frame和Series
2.
(1) 使用unique进行唯一性判断
(2)使用value_count进行次数统计
(3)使用isin进行成员资格检查
第五章
一:
A
A
C
A
二:
步骤1:绘制画布
步骤2:添加子图并绘制图形
步骤3:规定x,y轴及相关标签
步骤4:保存图片或者显示
三:
略
第六章
参考答案:
一:
1. Timestamp, Period, Timedelta,DatetimeIndex,PeriodtimeIndex, TimedeltaIndex
2. to_timestamp
3. 获取对应的日期的星期名(如Wonday)
4. floor, ceil, round
二:
1.D
2.A
3.A
4.A
5.B
三:
略
四:
更正结果
1.
import pandas as pd
time_index = pd.date_range(1/1/20,periods = 10 , freq =1h30min)
print(time_index)
2.
import pandas as pd
rng = pd.period_range(1/1/2000, 6/30/2000, freq = M)
print(rng)
3.
p = pd.Period(2019, freq = A-DEC)
time = p.asfreq(D) # 年初
print(time)
第七章
一.
1. how 字符串类型 inner
2. concat
3. corr method
4. 量纲 [0,1] 或者[-1,1]
5. 最大-最小标准化方法、Z-score标准化方法、小数定标标准化方法。
二.
1. D
2. C
3. D
4. A
5. A
三.
1. 错
2. 对
3. 错
4. 对
四.
1 .箱型图 和 基于3 σ方法
箱型图的
优点:直观、方便
缺点:数据量比较大时不能直接观察确切的值
3 σ方法:
优点:能够将值的分离出来
缺点:数据源只能是服从正态分布
五.
略
第八章
一. 填空题
1. 文本处理常用的Python库有____和____。
2. jieba库支持____、____、____三种分词模式。
3. NLTK库由____、____、开发而成。
4. 文本相似度分析可以使用____库和____库。
5. 文本情感分析又被称为____、和____、,指的是带有情感色彩的主观性文本进行____、____、____、和____的过程
1. NLTK\jieba
2. 精确模式 全模式 搜索引擎模式
3. Steven Bird Edward Lope
4. NLTK gensim
5. 倾向性分析 意见挖掘 分析 处理 归纳 推理
二. 选择题
1. 下列关于jieba 说法正确的是( )
A. jieba分词包含4种工作模式
B. jieba分词可以用于英文文本
C. jieba分词的默认模式为精确模式
D. jieba分词可以自定义停止词词典
2. 下列关于NLTK说法正确的是( )
A. NLTK可以用于若干种语言
B. NLTK不可用于中文文本分析
C. NLTK词性标注CC表示连击词
D. NLTK免费开源
3. 下列关于文本相似度分析说法不正确的是( )
A. gensim使用词袋模型进行文本分析
B. token2id值是词典中词语的序号
C. 文本相似度计算的对象是词频向量
D. 余弦相似度计算能表示所有文本内容的比较
4. 下列关于情感分析说法不正确的是( )
A. 情感分词主要使用train函数训练模型
B. 词典分词不适合大量的文章
C. 朴素贝叶斯分析不适合小量的文章
D. 情感分析有又称为意向挖掘
1-4: C C D C
三. 判断题
1. NLTK分词只能用于英文。( )
2. jibe分词只能用于中文。( )
3. 停止词对文本分析没有任何帮助。 ( )
4. jieba分词在词干提取时可以使用并
您可能关注的文档
- 青春健康教育 课件全套 第1--5单元 认识“性”---成长之“网.ppt
- 大学生心理素质拓展 课件全套 第1--6篇 自我成长--组织管理本.ppt
- 大数据营销 课件 2.大数据与营销.ppt
- 大数据营销 课件 3.大数据营销策略及应用.ppt
- 大数据营销 课件 4.大数据营销全流程.ppt
- 大数据营销 课件 5.大数据处理实战.ppt
- 大数据营销 课件 6.大数据与跨境电商.ppt
- 大数据营销 课件 7.大数据营销人才能力素质.ppt
- 大数据营销 课件 1.大数据概论.ppt
- 大数据营销 课件 8.大数据营销伦理.ppt
- Python快乐编程——数据分析与实战 课件 第1章 数据分析概述.pptx
- Python快乐编程——数据分析与实战 课件 第2章 IPython的使用.pptx
- Python快乐编程——数据分析与实战 课件 第3章 NumPy的使用.pptx
- Python快乐编程——数据分析与实战 课件 第4章 Pandas的使用.pptx
- Python快乐编程——数据分析与实战 课件 第5章 Matplotlib的使用.pptx
- Python快乐编程——数据分析与实战 课件 第6章 时间序列分析.pptx
- Python快乐编程——数据分析与实战 课件 第7章 数据处理的基本手段.pptx
- Python快乐编程——数据分析与实战 课件 第8章 基于文本的自然语言分析.pptx
- Python快乐编程——数据分析与实战 课件 第9章 ScikitLearn数据建模.pptx
- Python快乐编程——数据分析与实战 课件 第10章 数据可视化进阶.pptx
文档评论(0)