数据结构之字符串.ppt

  1. 1、本文档共45页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据结构之字符串

字符串 3 字符串 主要内容 字符串抽象数据类型 字符串的存储结构和类定义 字符串运算的算法实现 字符串的模式匹配主要掌握3.4.1 字符串抽象数据类型 基本概念 字符串抽象数据类型 String抽象数据类型 重要性 串(字符串),是计算机非数值处理的主要对象之一。 如,在汇编和编译程序中,源程序和目标程序都是串; 如,在事务处理程序中,顾客的姓名和地址,以及货物的名称、产地和规格等,通常也都作为串处理。 由于我们现今使用的计算机的硬件结构主要是面向数值计算的需要,基本上没有提供对串进行操作的指令,因此需要用软件来实现串数据类型。 基本概念 字符串,由0个或多个字符的顺序排列所组成的复合数据结构,简称“串”。 串的长度:一个字符串所包含的字符个数。 空串:长度为零的串,它不包含任何字符内容。 字符(char) :组成字符串的基本单位 。 串 由零个或多个字符组成的有限序列。 记作 S=a1a2…an 串名:S; 串值:用双引号括起来的字符序列。 长度:串中字符的数目。 空串:含零个字符的串,?表示。 空格串:由一个或多个空格组成的串。 子串:串中任意个连续的字符组成的子序列。 字符在串的位置:字符在序列中的序号。 子串在串的位置:子串的第一个字符在串中的位置。 相等:当且仅当两个串的值相等。 串与线性表区别 串的数据对象约束为字符集。 串的基本操作与线性表有很大差别 线性表的基本操作中,大多以“单个元素”作为操作对象,如查找某个元素、在某个位置上插入一个元素和删除一个元素。 串的基本操作中,通常以“串的整体”作为操作对象。如在串中查找某个子串、在串的某个位置上插入一个子串以及删除一个子串。 例子 a=BEI b=JING c=BEIJING d=BEI JING 长度分别为3、4、7、8; a和b都是c和d的子串; a在c和d中的位置都是1; b在c和d中的位置是4和5; a、b、c、d彼此不相等。 String抽象数据类型 字符串类(class String): 不采用char S[M]的形式 而采用一种动态变长的存储结构。 String串的常用操作(二) 赋值算子= 拼接算子+ 比较算子 = = != 和 == 重载下标算子[] char operator[] (int n); 按字符定位下标 int Find(char c,int start); 反向寻找,定位尾部出现的字符 int FindLast(char c); 串的表示和实现 字符串的存储结构和类定义 字符串的顺序存储 用一个特殊的末尾标记\0。 字符串类class String的存储结构 例如抽取子串函数: String s1 = value-; s2 = s1.Substr(2,3); 上述语句涉及的存储形式如下页所示。 字符串类class String的存储结构 堆分配存储表示 系统开辟一个串值存储空间(串值可利用空间) ,同时建立一个符号表; 建立一个新串时,在可利用空间分配,并在符号表中记录下串变量名、串值在可利用空间的位置、串长度等信息。 串的块链存储表示 用链表方式存储串值,每个结点大小相同。 结点分为两个域 data域 next域 链式存储特点 :用链表存储串值,易插入和删除。 字符串的模式匹配 在串T中查找是否有与串P相等的子串,则称串T为目标(Target),把P称为模式(Pattern)。 称查找模式在目标中的匹配位置的运算为模式匹配(Pattern matching)。 模式匹配算法 简单模式匹配算法 BF算法 (又称古典的、经典的、朴素的、穷举的) 带回溯,速度慢 KMP(Knuth-Morris-Pratt)算法 避免回溯,匹配速度快 T=“longlonglongago”; P=“longlongago”; 简单匹配算法思想 算法设计思想: 将主串S的第pos个字符和模式T的第1个字符比较, 若相等,继续逐个比较后续字符; 若不等,从主串S的下一字符(pos+1)起,重新与T第一个字符比较。 直到主串S的一个连续子串字符序列与模式T相等。返回值为S中与T匹配的子序列第一个字符的序号,即匹配成功。 否则,匹配失败,返回值 0 . 简单模式匹配算法过程 简单匹配算法代码 int Find(char* target, char* pat) { int i=0,j=0; int lengthP =strlen(pat), lengthT =strlen(target); while(i=lengthT-lengthP) { j=0; while(target[i]==pat[j]jlengthP){

您可能关注的文档

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档