- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
表4-1 電腦稽核常用指令-以Python 為例
目的與說明 功能 PYTHON
確認及發現:從 確保資料屬性 #以下以df 代表處理檔名
表格中獲取一般 是否和指定欄 type(df) #詢問檔案型態
資訊(資料品質的 位型態相符。 df.dtypes #詢問各欄位資料型
確認與資料淨化) 態
df.columns #詢問各欄位名稱
df.shape #查詢dataframe 的維度
資料
df.tail() #最後五行
df.shape #了解資料表的2 維
架構
紀錄筆數。 df.count() #所有欄位計數
#可透過統計或groupby()進階處理
欄位加總。 df.sum() #可能欄位加總
#可透過統計或groupby()進階處理
統計分析 :記 #各種統計數值,最大、最小、中位
錄筆數、欄位 數、標準差、記數、總數等等
加總、平均 df.count() #非空元素計算
值、絕對值、 df.min() #最小值
全距、標準 df.max() #最大值
差、最小、最 df.idxmin()
大值等 ,掌握 #最小值的位置,類似R 的which.min
資料表中的內 df.idxmax()
容特徵 ,提供 #最大值的位置,類似R 的which.max
後續的查核方 df.quantile(0.1) #10%分位数
向或分析的目 df.sum() #求和
標 。 df.mean() #均值
df.median() # 中位數
df.mode() #眾數
df.var() #方差
df.std() #標準差
df.mad()
您可能关注的文档
- 标底编制说明.DOC
- 标价清单-长荣大学.DOC
- 标签名称属性名称及设定值.DOC
- 标题PDRK一种强大的动理学等离子体色散关系求解算法报告人.DOC
- 标题与文本-资源.PPT
- 标线-五福国中.PPT
- 标线型人行道绘设原则.DOC
- 标志订制申请程序.doc
- 标注语料-智能技术与系统国家重点试验室信息检索课题组.PPT
- 标准编制说明-浙江机械工业联合会.DOC
- Haier海尔413升风冷变频多门冰箱 BCD-413WGHFD1BSJU1(白)说明书用户手册.pdf
- Siemens西门子工业抽屉式断路器主回路后垂直连接 抽屉式断路器主回路后垂直连接使用手册.pdf
- Samsung三星智能佩戴设备 Galaxy Fit3安全手册.pdf
- Samsung三星滚筒洗衣机 AI神 黑钻热泵洗烘旗舰 WD18DB8995BZSC使用手册.pdf
- Sakura樱花消毒柜 保洁柜消毒柜 SCQ-130D6用户手册说明书.pdf
- Hifiman头领科技ARYA UNVEILED说明书用户手册.pdf
- Siemens西门子工业抽屉式主回路连接前置端子 支撑件 抽屉式主回路连接前置端子 支撑件使用手册.pdf
- Siemens西门子工业中性线的外部电流传感器 中性线的外部电流传感器使用手册.pdf
- Siemens西门子工业电子脱扣单元 电子脱扣单元使用手册.pdf
- Razer雷蛇Playstation 专用雷蛇战锤狂鲨极速版 RZ12-038203 用户指南 (简体中文)说明书用户手册.pdf
文档评论(0)