- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
口令:RAPID708 第4章 字符串、元组和字典 学习目标 掌握字符串格式化的使用。 掌握字符串常用方法。 掌握使用正则表达式进行数据清洗。 掌握元组的特性和使用。 掌握字典的特性和使用。 字符串 最开始的字符串编码是美国标准信息交换码(ASCII),它采用1个字节对字符进行编码,最多只能表示256个符号(10个数字、26个大写英文字母、26个小写英文字母及一些其他符号)。随着信息技术的发展和信息交互的需要,各国的文字都需要进行编码,不同的应用领域和场合对字符串编码的要求也略有不同,此时又分别设计多种不同的编码格式,常见的主要有UTF-8、UTF-16、UTF-32、GB2312、GBK、CP936、base64、CP437等,Python3.X默认编码格式是UTF-8。 字符串格式化 在Python编程中字符串输入与输出可以使用字符串格式化的方式进行操作。 使用格式如下: % [Flags][Width].[Precision]Type 说明: “%”:是转换说明符的开始。 “Flags”:(可选项)可供选择的值有: “+”:正数前加正号,负数前加负号。 “-”:左对齐。 “ ”:正数前加空格。 “0”:位数不够用“0”填充空。 “Width”:(可选项)字段占有宽度。 “.Precision”:(可选项)精度,小数点后保留的位数。 “Type”:转换类型(如表4-1所示)。 字符串格式化 常用格式字符: 字符串格式化 num=3438 buf=%o%num buf 6556 buf=%X%num buf D6E buf=%f%num/345 buf=%f%(num/345) buf 9.965217 buf=%e%(num/345) buf 9.965217e+00 字符串方法 字符串常用方法: find( )方法 str1=Hello Python I like you str1.find(like) 15 count( )方法 str1=Hello World, Hello Python. str1.count(Hello) 2 split( )方法 str1=1+2+3+4+5+6+7 str1.split(+) [1, 2, 3, 4, 5, 6, 7] join( )方法 str1=[1,2,3,4,5,6,7] sep=+ sep.join(str1) 1+2+3+4+5+6+7 replace( )方法 str1=Hello,Python! str1.replace(Python,World) Hello,World! strip( )方法 str1= Hello World #删除空格 str1.split() [Hello, World] str1.split(H) #删除指定字符“H” [ , ello World ] 正则表达式 正则表达式是字符串处理的有力技术,通常被用来检索、替换那些符合某个规则的文本等,例如,网络爬虫、文稿整理或数据筛选等。在Python中提供了“re”模块来支持正则表达式。 正则表达式在匹配文本内容时有两种匹配模式。一种是贪婪模式,尽可能的匹配更多的内容,另一种是非贪婪模式,总是尝试匹配尽可能少的字符。例如,使用正则表达式“adc*?”如果用于查找“abcdefg”,使用贪婪模式有可能将找到“abcdefghi”,而使用非贪婪模式查找就有可能找到“abcd”。Python中数量词默认使用贪婪模式。 正则表达式 正则表达式常用语法: 格式字符 说明 . 除换行符以外的任意单个字符 \w 匹配单词字符,即[a-zA-Z0-9] \W 匹配非单词字符集,例如 ‘*’ \d 匹配数字,即[0-9] \D 匹配非数字 \s 匹配空白字符 \S 匹配非空白字符 * 匹配前一个字符0次或者任意多次 + 匹配前一个字符1次或者任意多次 ? 匹配前一个字符0次或者1次 {m} 匹配前一个字符m次 {m,n} 匹配前一个字符最少m次,最多n次 *? 非贪婪模式匹配前一个字符0次或者任意多次 +? 非贪婪模式匹配前一个字符1次或者任意多次 ?? 非贪婪模式匹配前一个字符0次或者1次 {m,n}? 非贪婪模式匹配前一个字符最少m次,最多n次 ^ 匹配字符串开头 $ 匹配字符串结尾 \A 制定的字符串匹配必须出现在开头 \Z 制定的字符串匹配必须出现在结尾 | 匹配左右任意一个表达式,相当于“或”的含义 () 匹配一个分组,括号中为该分组所需匹配的内容 \number 引用匹配编号为number的分组中的字符串 (?Pgroup_name) 为匹配分组制定特定的组名 (?P=group_name) 引用特定组名的匹配字符串 正则表达式 “re”模
您可能关注的文档
- 《Python程序设计》课程标准.doc
- 《Python程序设计》课件—01入门.ppt
- 《Python程序设计》课件—02基础知识.ppt
- 《Python程序设计》课件—03条件、循环语句、列表和函数.ppt
- 《Python程序设计》课件—05面向对象设计和异常处理.ppt
- 《Python程序设计》课件—06文件操作.ppt
- 《Python程序设计》课件—07图形用户界面.ppt
- 《Python程序设计》课件—08数据分析和可视化.ppt
- 《Python程序设计》课件—09数据库支持.ppt
- 《Python程序设计》课件—10网络编程.ppt
- 浙江省温州市浙南名校联盟2025-2026学年高一上学期期中联考数学试题含解析.docx
- 26高考数学提分秘诀重难点34圆锥曲线中的定点、定值、定直线问题(举一反三专项训练)(全国通用)(含解析).docx
- 26高考数学提分秘诀重难点35概率与统计的综合问题(举一反三专项训练)(全国通用)(含解析).docx
- 26高考数学提分秘诀重难点31圆锥曲线中的切线与切点弦问题(举一反三专项训练)(全国通用)(含解析).docx
- 26高考数学提分秘诀重难点30圆锥曲线中的弦长问题与长度和、差、商、积问题(举一反三专项训练)(全国通用)(含解析).docx
- 26高考数学提分秘诀重难点29巧解圆锥曲线的离心率问题(举一反三专项训练)(全国通用)(含解析).docx
- 26高考数学提分秘诀重难点28直线与圆的综合(举一反三专项训练)(全国通用)(含解析).docx
- 寡核苷酸药物重复给药毒性研究技术指南.docx
- 重组溶瘤腺病毒生产质量管理标准.docx
- 26高考数学提分秘诀重难点27直线与圆中常考的最值与范围问题(举一反三专项训练)(全国通用)(含解析).docx
最近下载
- 英语丨天一大联考安徽省2025届高三12月联考英语试卷及答案.docx VIP
- 北京师范大学《艺术概论》2023-2024学年第一学期期末试卷.doc VIP
- 人教版八年级上册英语 Units 1-5单元复习测试卷(Word版,含答案).docx VIP
- 全国新高考:历史重点基础知识点大全.doc VIP
- 2025年人工智能在地质勘探领域的应用分析及未来五到十年行业趋势报告.docx
- 法医学图鉴 _原创文档.pdf VIP
- 北京师范大学《劳动教育实践》2022-2023学年第一学期期末试卷.doc VIP
- 第3单元单元活动 学用地形图探究地貌特征课件(24张PPT).pptx VIP
- 雨污分流施工规定合同书文本(2025版).docx VIP
- 施工电梯拆除技术交底 .pdf VIP
原创力文档


文档评论(0)