chapter26字符串.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
chapter26字符串

字符串 */40 作业 上机作业: 实现简单(朴素)的字符串匹配算法 P80:17,18 2.7.3 简易文本编辑器 纸面作业(抽查) P80:16 字符串 */40 后续内容 第3章 树 * * * * * * * * Class String 中的更多操作请参见教材。 * * * * * * * * * * 例如,在拼写检查、语言翻译、数据压缩、搜索引擎、网络入侵检测、计算机病毒特征码匹配以及DNA序列匹配等应用中, 每当一趟匹配过程中出现字符比较不等时,不需回溯目标指针,而是利用已经得到的“部分匹配”的结果将模式向右‘滑动’尽可能远的一段距离后,继续进行比较。 * 黑板例子: T:acabcabd P:abcabd(x) * * * 数据结构与算法 2.6 字符串 字符串 */40 主要内容 基本概念 存储结构和实现 字符串运算的算法实现 字符串的模式匹配 字符串 */40 基本概念 字符串,由0个或多个字符的顺序排列所组成的复合数据结构,简称“串”。 串的长度:一个字符串所包含的字符个数。 空串:长度为零的串,它不包含任何字符内容。 字符(char) :组成字符串的基本单位 。 字符串 */40 串中任意个连续的字符组成的子序列称为该串的子串。 包含子串的串相应的称为主串。 例,串 eij 是串 beijing 的子串, beijing 称为主串。 字符在序列中的序号称为该字符在串中的位置。 子串在主串中的位置定义为子串的第一个字符在主串中的位置。 例,字符 ‘n’ 在串 beijing 中的位置为 6 。 例,子串 eij 在串 beijing 中的位置为 。 2 字符串 */40 两个串相等,当且仅当这两个串的值相等。 例,串 bei jing 与串 beijing 不相等 。 串值必须用一对单引号括起来,但单引号本身不属于串,只起界定作用。 由一个或多个空格组成的串称为空格串。 φ ≠ 字符串 */40 串与线性表区别 串的数据对象约束为字符集。 串的基本操作与线性表差别 线性表的基本操作中,大多以“单个元素”作为操作对象,如查找某个元素、在某个位置上插入一个元素和删除一个元素。 串的基本操作中,通常以“串的整体”作为操作对象。如在串中查找某个子串、在串的某个位置上插入一个子串以及删除一个子串。 字符串 */40 串的常用操作(二) 赋值算子= 拼接算子+ 比较算子 = = != 和 == 重载下标算子[] char operator[] (int n); 按字符定位下标 int Find(char c,int start); 反向寻找,定位尾部出现的字符 int FindLast(char c); 字符串 */40 字符串的存储结构和类定义 字符串的顺序存储 用一个特殊的末尾标记‘\0’。 字符串类class String的存储结构 例如抽取子串函数: String s1 = value-; s2 = s1.Substr(2,3); 上述语句涉及的存储形式如下页所示。 字符串 */40 字符串类class String的存储结构 字符串 */40 字符串的模式匹配 在串T中查找是否有与串P相等的子串,则称串T为目标(Target),把P称为模式(Pattern)。 称查找模式在目标中的匹配位置的运算为模式匹配(Pattern matching)。 字符串 */40 模式匹配算法 简单模式匹配算法 BF算法 (又称古典的、经典的、朴素的、穷举的) 带回溯,速度慢 KMP(Knuth-Morris-Pratt)算法 避免回溯,匹配速度快 T=“longlonglongago”; P=“longlongago”; 字符串 */40 简单匹配算法思想 将主串S的第pos个字符和模式T的第1个字符比较, 若相等,继续逐个比较后续字符; 若不等,从主串S的下一字符(pos+1)起,重新与T第一个字符比较。 直到主串S的一个连续子串字符序列与模式T相等。返回值为S中与T匹配的子序列第一个字符的序号,即匹配成功。 否则,匹配失败,返回值 0 . 字符串 */40 简单模式匹配算法过程 l o n g l o n g l o n t0 t1 t2 t3 t4 t5 t6 t7 t8 t9 t10 g a g t11 t12 t13 o \0 t14 t15 l o n g l o n g p0 p1 p2 p3 p4 p5 p6 p7 a g o \0 p8 p9 p10 p11 j i j i j i j i j i j i j i j i j i j i j i j i j i

文档评论(0)

173****7830 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档