- 1、本文档共18页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
任务2.5模块——查询女学生的学号与姓名PowerpointdesignPowerpoint
任务描述01数据框03模块02CONTENT目录实施过程04
01任务描述Powerpoint
本任务数据是一张excel表,对应Python的数据结构是数据框。任务数据
使用数据框,首先要导入pandas模块。Pandas包是基于Python平台的数据管理利器,已经成为了Python进行数据分析和挖掘时的数据基础平台和事实上的工业标准。使用Pandas包完成数据读入、数据清理、数据准备、图表呈现等工作,为继续学习机器学习打下坚实基础。数据框使用
02模块Powerpoint
模块实现代码复用,减少开发成本的举措。Python中的模块可分为三类:内置模块、第三方模块和自定义模块。模块分类
导入模块语法如下:python.
import模块名-如:importpandas.
如果模块名称较长的模块,可使用as为这些模块起别名,语法格式如下:python.
import模块名as别名-如:importpandasaspd.
如果只希望导入模块中指定的类或函数,其语法如下:python.
from模块名import类或函数名-如:fromsklearn.datasetsimportnames.
在使用第三方模块之前,需要使用包管理工具——pip下载和安装第三方模块。其语法如下:python.
pipinstall模块名-如:pipinstallpandas.模块导入
Python内置了许多标准模块,例如math、sys、os、random和time模块等。标准模块
1)NumPy是Python科学计算的基础工具包,它支持大量的维数组和矩阵运算,也为数组运算提供了大量的数学函数库。
2)Pandas是Python数据分析的库,提供二维数据结构数据框的相关操作。
3)Plotly支持许多图形,用于可可视化。
4)Scikit.learn机器学习的核心程序库,封装了大量经典的机器学习模型。
5)NLTK(NaturalLanguageToolkit)自然语言处理工具包。常用第三方模块
03数据框Powerpoint
①方法1:dict1={key1:[values1],key2:[values2],……}
pd.DataFrame(dict1)-②快速体验:python.
importpandasaspd.
dict1={name:[Tony,Nancy,Judy,Cindy],age:[16,17,18,15],sex:[male,female,female,female]}
df2=pd.DataFrame(dict1)
df2.
方法2:df=pd.DataFrame(pd.read_excel(文件名))01创建数据框
df.head(n)方法返回前n行,默认是5。
df.tail(n)方法返回后n行,默认是5。
df.info()方法查看数据表中的数据类型,而且不需要一列一列的查看,df.info()可以输出整个表中所有列的数据类型。
df.shape()方法会以元组的形式返回行、列数。
df.describe()方法就是可以就可以获取所有数值类型字段的分布值。02了解数据
传入的是行所在行索引的名称。python.
df1.loc[2]#返回行索引为2的行。
df1.loc[[1,3]]#选择第1行和第3行。
传入的是行的绝对位置。python.
df1.iloc[2]#返回行第3行。
df1.iloc[:2]#选择前2行。
df1.iloc[[0,2]]#选择第1行和第3行,或df1.loc[[1,3]]
df[df[column_name]==value]#单一条件过滤。
df[(df[column_name1]=value2)(df[column_name2]==value2)]#多条件过滤。
df[df[Col3]关系表达式value][[Col1,Col2]]#过滤满足条件的列。
03访问数据
df1[name]#选择name列。
df1[[name,num]]#多列名要用列表。
df1.name#选择name列,只能选择一列。
传入的是行所在行索引,所在列的名称。python.
df1.loc[[1,3
您可能关注的文档
- 人工智能应用基础教学大纲.docx
- 人工智能应用基础项目式教程 课件 任务1.1-智能电视方案.pptx
- 人工智能应用基础项目式教程 课件 任务1.2-新零售.pptx
- 人工智能应用基础项目式教程 课件 任务1.3-认识机器人.pptx
- 人工智能应用基础项目式教程 课件 任务1.4-抓住新一代人工智能发展的新机遇.pptx
- 人工智能应用基础项目式教程 课件 任务2.1-Python+编程入门:从打招呼开始.pptx
- 人工智能应用基础项目式教程 课件 任务2.2+分支结构——计算应发放奖金.pptx
- 人工智能应用基础项目式教程 课件 任务2.3+循环结构——重复打印一句话100遍.pptx
- 人工智能应用基础项目式教程 课件 任务2.4+数据结构——账号密码登录模拟.pptx
- 人工智能应用基础项目式教程 课件 任务3.1+安装python机器学习算法库.pptx
- DB44_T 2611-2025 城市排水管网有毒有害气体监测与风险分级管理技术标准.pdf
- DB44_T 2612-2025 竞赛类科普活动策划与实施服务规范.pdf
- DB43_T 2947-2024 烟草种子质量控制规程.pdf
- DB37_T 4836-2025 煤矿风量实时监测技术要求.pdf
- 叉车防撞系统,全球前22强生产商排名及市场份额(by QYResearch).docx
- 超滤膜,全球前18强生产商排名及市场份额(by QYResearch).docx
- DB62T 4172-2020 玉米品种 酒623规范.pdf
- DB62T 4160-2020 在用真空绝热深冷压力容器综合性能在线检测方法.pdf
- DB62T 4164-2020 辣椒品种 酒椒1号.pdf
- DB62T 4133-2020 公路隧道地质超前预报机械能无损探测技术规程.pdf
文档评论(0)