- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实验二 Numpy数值计算
.实验类型
设计研究
.实验目的和要求
掌握Numpy数组对象的创建和随机数的生成;
掌握Numpy数组对象的索引与变换;
掌握Numpy中读/写文件的方法;
能利用Numpy进行简单的统计分析。
.实验内容
题目一:创建数组并计算
? 创建100个服从正态分布的随机数,数组形态为2维数组。
?创建两个数组,进行四则运算。
题目二:电子商务数据统计分析
项目介绍:
随着社会经济的发展,人们对服装的需求越来越多样化,而女性服装的变化也 成为值得分析的一个关注点。这个项目的目的是对女性的服装进行分析,以了解 客户对女性服装的态度。
数据集分析
项目的数据集内容主要是客户对服装的评论,数据集包括23486行和8个特征 变量(列数,不包含索引列),而每一行包含了一个客户对服装的评论和其他相 关信息。
? Clothing ID:服装的唯一 ID号
Age:评论者的年龄
Rating:评论员对服装的评级,从1到5, 1最差,5最好
Recommended IND:服装是否被评论家推荐,推荐为1,不推荐为0
Positive Feedback Count:正反馈计数
Division Name:服装高级分类的分类名称
Department Name:服装部门名称的分类名称
Class Name:服装分类名称
基于Numpy,完成以下内容:
1) 使用numpy相应的读文件数据方法,根据给定列Clothing ID Age、 Recommended IND Class Name获得相应的数据集,并统计Clothing ID的评论 数,我们希望仅对评论数大于300的Clothing ID的数据进行分析,要求输出评 论数大于300的Clothing ID与相应的评论数,结果按照评论数从大到小排列。
2) 统计在评论数大于300的Clothing ID评论中,对应评论者的年龄段分布, 其中年龄段包括:青少年(小于20岁)、青年(20-39岁)、中年(40-59岁)、老年(大 于60岁)。输出格式:在Clothing ID为xx的评论中,青少年评论数有xx条,青 年评论数有xx条,中年评论数有xx条,老年评论数有xx条。
3) 计算评论数大于300的Clothing ID的受欢迎程度。计算公式为:推荐数/总 评价数。比如Clothing ID=1的有10条评论,其中有5条为被推荐,则Clothing ID=1的评论次数为10,推荐次数为5,该服装的受欢迎程度为:5/10=0.5。要求 输出Clothing ID与受欢迎程度。
4) 使用numpy相应的写文件数据方法,将上述的Clothing ID的统计信息保 存到csv文件中。
其中标题栏为:ID,类别,受欢迎指数,总评论数,青少年评论数,青年评论数,中年 评论数,老年评论数
4.实验背景知识
NumPy(NumericalPython)是高性能科学计算和数据分析的基础包。它是本课介 绍的几乎所有高级工具的构建基础。具体应用参考课程代码。
4.1数组创建
1)用array函数来创建数组
可以将列表、元组、嵌套列表、嵌套元组等给定的python序列转化为数组
In [1]: import numpy as np
#创建_个—维数页,参数Python的单元素List a = np. array ([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
a
Out [1]:
array([
1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
In [2]:
#创建- b = np.
b
-个二维数组,参数为Python的嵌套List array ([[1, 2, 3, 4, 5], [6, 7, 8, 9, 10]])
Out [2]:
array(
er
[1, 2, 3, 4, 5],
[6, 7, 8, 9, 10]])
使用numpy函数创建数组
arange函数:类似于python的range函数,通过指定开始值、终值和步 长来创建一维数组
linspace函数:linspace函数通过指定开始值、终值和元素个数来创建一 维数组
logspace函数:创建等比数列
zeros:创建一个用指定形状用0填充的数组
eye:创建一个主对角线为1,其它为0的数组
diag:创建一个除对角线全为0的数组
ones(shape):创建一个用指定形状用1填充的数组
通过生成随机数的np.random模块创建数组
np.(shape):生成0到1之间的n个随机数
np. (shape)返回一个符合标准正态分布的数组(均值0,方差1)
np.nt (m,n,size)生成一个给定上下限范围的随机数数组([m,n))左闭右
4.2数组常用属性
返回血。表示数组的维
原创力文档


文档评论(0)