python 数据了解入门_基本数据类型 python培训机构.pdfVIP

下载本文档

1
0
约1.09万字
约 10页
2018-07-18 发布于湖北
举报
版权申诉

python 数据了解入门_基本数据类型 python培训机构.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

python 数据了解入门_基本数据类型 python培训机构

光环大数据--大数据培训人工智能培训 Python 数据分析入门_基本数据类型 Python 培训机构最近，Analysis with Programming 加入了Planet Python。作为该网站的首批特约博客，我这里来分享一下如何通过Python 来开始数据分析。具体内容如下：数据导入导入本地的或者web 端的CSV 文件；数据变换；数据统计描述；假设检验单样本t 检验；可视化；创建自定义函数。数据导入这是很关键的一步，为了后续的分析我们首先需要导入数据。通常来说，数据是CSV 格式，就算不是，至少也可以转换成CSV 格式。在Python 中，我们的操作如下： import pandas as pd# Reading data locallydf =pd.read_csv(/Users/al-ahmadgaidasaad/Documents/d.csv)# Reading data from webdata_url =/alstat/Analysis-with-Programming/ 光环大数据光环大数据--大数据培训人工智能培训 master/2014/Python/Numerical-Descriptions-of-the-Data/data.csvdf = pd.read_csv(data_url) 为了读取本地CSV 文件，我们需要pandas 这个数据分析库中的相应模块。其中的read_csv 函数能够读取本地和web 数据。数据变换既然在工作空间有了数据，接下来就是数据变换。统计学家和科学家们通常会在这一步移除分析中的非必要数据。我们先看看数据： # Head of the dataprint df.head()# OUTPUT Abra Apayao Benguet Ifugao Kalinga0 1243 2934 148 3300 105531 4158 9235 4287 8063 352572 1787 1922 1955 1074 45443 17152 14501 3536 19607 316874 1266 2385 2530 3315 8520# Tail of the dataprint df.tail()# OUTPUT Abra Apayao Benguet Ifugao Kalinga74 2505 20878 3519 19737 1651375 60303 40065 7062 19422 6180876 6311 6756 3561 15910 2334977 13345 38902 2583 11096 6866378 2623 18264 3745 16787 16900 对R 语言程序员来说，上述操作等价于通过print(head(df))来打印数据的前6 行，以及通过print(tail(df))来打印数据的后6 行。当然Python 中，默认打印是5 行，而R 则是6 行。因此R 的代码head(df, n = 10)，在Python 中就是df.head(n = 10)，打印数据尾部也是同样道理。在R 语言中，数据列和行的名字通过colnames 和rownames 来分别进行提取。在Python 中，我们则使用columns 和index 属性来提取，如下： # Extracting column namesprint df.columns# OUTPUTIndex([uAbra, uApa