- 7
- 0
- 约3.9千字
- 约 6页
- 2023-07-17 发布于重庆
- 举报
python分析两组数据的差异_3步搞懂Python数据分析关键点
和很多同学接触过程中,我发现 ⾃学P thon数据分析的⼀个难点是资料繁多,过于复杂。⼤部分⽹上的资料总是从P thon语法教起,夹杂
着⼤量P thon开发的知识点,花了很多时间却始终云⾥雾⾥,不知道哪些知识才是真正有⽤的。本来以为上⼿就能写爬⾍出图,却在看基
础的过程中消耗了⼀周⼜⼀周,以⾄于很多励志学习P thon的⼩伙伴牺牲在了⼊门的前⼀步。
于是,我总结了以下⼀篇⼲货,来帮助⼤家理清思路,提⾼学习效率。总共分为三⼤部分 :做P thon数据分析必知的语法,如何实现爬
⾍,怎么做数据分析。
1.必必须须知知道道 的的两两组组 Python基基础础术术语语
A.变量和赋值
P thon可以直接定义变量名字并进⾏赋值的,例如我们写出a = 4时,P thon解释器⼲了两件事情 :
在内存中创建了⼀个值为4的整型数据
在内存中创建了⼀个名为a的变量,并把它指向4
⽤⼀张⽰意图表⽰P thon变量和赋值的重点 :
例如下图代码, “=”的作⽤就是赋值,同时P thon会 ⾃动识别数据类型:
a=4 #整型数据b=2 #整型数据c=“4” #字符串数据d=“2” #字符串数据print(“a+b结果为” ,a+b)#两个整数相加,结果是6print(“c+d结果为” ,c+d)#两个⽂本合并,结果
B.数据类型
在初级的数据分析过程中,有三种数据类型是很常见的:
列表list(P thon内置)
字典dict(P thon内置)
DataFrame(⼯具包pandas下的数据类型,需要import pandas才能调⽤)
它们分别是这么写的:
列表(list) :
#列表liebiao=[1 2.223 -3 刘强东 章泽天 周杰伦 昆凌 [微博 B站 抖⾳]]
list是⼀种 有序的集合,⾥⾯的元素可以是之前提到的任何⼀种数据格式和数据类型(整型、浮点、列表……),并可以随时指定顺序
添加其中的元素,其形式是 :
#ist是⼀个可变的有序表,所以,可以往list 中追加元素到末尾 :liebiao.append(瘦)print(liebiao)#结果1[1 2.223 -3 刘强东 章泽天 周杰伦 昆凌 [微博 B
字典(dict) :
#字典zidian={刘强东:46 章泽天:36 周杰伦:40 昆凌:26}
字典使⽤ 键-值(ke -value)存储,⽆序,具有极快的查找速度。以上⾯的字典为例,想要快速知道周杰伦的年龄,就可以这么写:
zidian[周杰伦]40
dict内部存放的顺序和ke 放⼊的顺序是没有关系的,也就是说,章泽天并⾮是在刘强东的后⾯。
DataFrame:
DataFrame可以简单理解为Excel⾥的表格格式。导⼊pandas包后,字典和列表都可以转化为DataFrame,以上⾯的字典为例,转化为
DataFrame是这样的:
import pandas as pddf=pd.DataFrame.from_dict(zidian orient=index columns=[age])#注意DataFrame的D和F是⼤写df=df.reset_ index().rename(columns={inde
和excel⼀样,DataFrame的任何⼀列或任何⼀⾏都可以单独选出进⾏分析。
以上三种数据类型是p thon数据分析中⽤的最多的类型,基础语法到此结束,接下来就可以着⼿写⼀些函数计算数据了。
2.从从 Python爬爬 ⾍⾍学学循循环环 函函数数
掌握了以上基本语法概念,我们就⾜以开始学习⼀些有趣的函数。我们以爬⾍中绕不开的遍历url为例,讲讲⼤家最难理解的循环函数for的
⽤法 :
A.for函数
for函数是⼀个常见的循环函数,先从简单代码理解for函数的⽤途 :
zidian={刘强东:46 章泽天:36 周杰伦:40 昆凌:26}for key in zidian: print(key)刘强东章泽天周杰伦 昆凌
因为dict的存储不是按照list的⽅式顺序排列,所以,迭代出的结果顺序很可能不是每次都⼀样。默认情况下,dict迭代的是ke 。如果要迭
代value,可以⽤for value in d.values(),如果要同时#迭代ke 和value,可以⽤for k, v in d.items()
可以看到,字典⾥的⼈名被⼀⼀打印出来了。for 函数的作⽤就是⽤于遍历数据。掌握for函数,可以说
您可能关注的文档
- python信用卡违约预测分析-Python数据分析及可视化实例之银行信用卡违约预测(24)....pdf
- python信用卡违约预测分析-Python机器学习实战:信用卡欺诈检测.pdf
- python共享单车数据分析-共享单车数据可视化分析(PythonSeaborn).pdf
- python关联分析如何可视化-Python共享单车数据可视化分析.pdf
- python写股票指标-用Python做股票指标RSI分析.pdf
- python函数可视化心得-最近关于数据可视化方面交流的心得感悟.pdf
- Python分析csv文件及可视化绘图.pdf
- python分析两组数据的差异-十分钟搞懂“Python数据分析”.pdf
- python分析数据的变化趋势及前景-Python数据分析三板斧.pdf
- python分析每月销售数据-如何用Python分析销售数据.pdf
- 安徽省华师联盟2025-2026学年高三上学期1月质量检测生物试卷+答案.doc
- 安徽省华师联盟2025-2026学年高三上学期1月质量检测语文试卷+答案.doc
- 四川省绵阳南山中学实验学校2025-2026学年高三上学期1月月考数学含答案.doc
- 2026届辽宁省大连市高三上学期双基考试物理试卷+答案.doc
- 辽宁名校联盟2026年1月高三上期末联考质量检测化学含答案.doc
- 辽宁名校联盟2026年1月高三上期末联考质量检测生物含答案.doc
- 辽宁名校联盟2026年1月高三上期末联考质量检测英语含答案.doc
- 辽宁名校联盟2026年1月高三上期末联考质量检测政治含答案.doc
- 黑龙江省龙江教育联盟2026年1月高三上学期期末考试化学含答案.doc
- 黑龙江省龙江教育联盟2026年1月高三上学期期末考试生物含答案.doc
最近下载
- 广州数控GSK980TA1-TA2-TB1-TB2车床数控系统 使用手册.pdf
- 虚实乱针绣入门.ppt VIP
- GB/T 42430-2023血液、尿液中乙醇、甲醇、正丙醇、丙酮、异丙醇和正丁醇检验.pdf
- 曲柄连杆机构的运动与受力分析讲解学习.pptx VIP
- 如此伟大的爱G波利切un amore cosi grande G-E-G-F-5P.pdf VIP
- 钛白废酸废水综合治理项目可行性研究报告.docx
- 陕09J02-屋面-标准图集.docx
- 中药当归中阿魏酸的提取工艺研究.pptx
- 蔬菜大棚建设实施方案范文(8篇).docx VIP
- 结合多源异构数据融合技术的人口增长时空预测模型构建及应用分析.pdf VIP
原创力文档

文档评论(0)