《Python程序设计》课件—04字符串、元组和字典.pptVIP

《Python程序设计》课件—04字符串、元组和字典.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
口令:RAPID708 第4章 字符串、元组和字典 学习目标 掌握字符串格式化的使用。 掌握字符串常用方法。 掌握使用正则表达式进行数据清洗。 掌握元组的特性和使用。 掌握字典的特性和使用。 字符串 最开始的字符串编码是美国标准信息交换码(ASCII),它采用1个字节对字符进行编码,最多只能表示256个符号(10个数字、26个大写英文字母、26个小写英文字母及一些其他符号)。随着信息技术的发展和信息交互的需要,各国的文字都需要进行编码,不同的应用领域和场合对字符串编码的要求也略有不同,此时又分别设计多种不同的编码格式,常见的主要有UTF-8、UTF-16、UTF-32、GB2312、GBK、CP936、base64、CP437等,Python3.X默认编码格式是UTF-8。 字符串格式化 在Python编程中字符串输入与输出可以使用字符串格式化的方式进行操作。 使用格式如下: % [Flags][Width].[Precision]Type 说明: “%”:是转换说明符的开始。 “Flags”:(可选项)可供选择的值有: “+”:正数前加正号,负数前加负号。 “-”:左对齐。 “ ”:正数前加空格。 “0”:位数不够用“0”填充空。 “Width”:(可选项)字段占有宽度。 “.Precision”:(可选项)精度,小数点后保留的位数。 “Type”:转换类型(如表4-1所示)。 字符串格式化 常用格式字符: 字符串格式化 num=3438 buf=%o%num buf 6556 buf=%X%num buf D6E buf=%f%num/345 buf=%f%(num/345) buf 9.965217 buf=%e%(num/345) buf 9.965217e+00 字符串方法 字符串常用方法: find( )方法 str1=Hello Python I like you str1.find(like) 15 count( )方法 str1=Hello World, Hello Python. str1.count(Hello) 2 split( )方法 str1=1+2+3+4+5+6+7 str1.split(+) [1, 2, 3, 4, 5, 6, 7] join( )方法 str1=[1,2,3,4,5,6,7] sep=+ sep.join(str1) 1+2+3+4+5+6+7 replace( )方法 str1=Hello,Python! str1.replace(Python,World) Hello,World! strip( )方法 str1= Hello World #删除空格 str1.split() [Hello, World] str1.split(H) #删除指定字符“H” [ , ello World ] 正则表达式 正则表达式是字符串处理的有力技术,通常被用来检索、替换那些符合某个规则的文本等,例如,网络爬虫、文稿整理或数据筛选等。在Python中提供了“re”模块来支持正则表达式。 正则表达式在匹配文本内容时有两种匹配模式。一种是贪婪模式,尽可能的匹配更多的内容,另一种是非贪婪模式,总是尝试匹配尽可能少的字符。例如,使用正则表达式“adc*?”如果用于查找“abcdefg”,使用贪婪模式有可能将找到“abcdefghi”,而使用非贪婪模式查找就有可能找到“abcd”。Python中数量词默认使用贪婪模式。 正则表达式 正则表达式常用语法: 格式字符 说明 . 除换行符以外的任意单个字符 \w 匹配单词字符,即[a-zA-Z0-9] \W 匹配非单词字符集,例如 ‘*’ \d 匹配数字,即[0-9] \D 匹配非数字 \s 匹配空白字符 \S 匹配非空白字符 * 匹配前一个字符0次或者任意多次 + 匹配前一个字符1次或者任意多次 ? 匹配前一个字符0次或者1次 {m} 匹配前一个字符m次 {m,n} 匹配前一个字符最少m次,最多n次 *? 非贪婪模式匹配前一个字符0次或者任意多次 +? 非贪婪模式匹配前一个字符1次或者任意多次 ?? 非贪婪模式匹配前一个字符0次或者1次 {m,n}? 非贪婪模式匹配前一个字符最少m次,最多n次 ^ 匹配字符串开头 $ 匹配字符串结尾 \A 制定的字符串匹配必须出现在开头 \Z 制定的字符串匹配必须出现在结尾 | 匹配左右任意一个表达式,相当于“或”的含义 () 匹配一个分组,括号中为该分组所需匹配的内容 \number 引用匹配编号为number的分组中的字符串 (?Pgroup_name) 为匹配分组制定特定的组名 (?P=group_name) 引用特定组名的匹配字符串 正则表达式 “re”模

您可能关注的文档

文档评论(0)

139****1983 + 关注
实名认证
文档贡献者

副教授、一级建造师持证人

从事职业教育近20年,高级职称。

领域认证该用户于2023年06月21日上传了副教授、一级建造师

1亿VIP精品文档

相关文档