- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
文本文件单词的检索与计数
专业:软件工程班级:1227班姓名:王晓春学号:2012005774
同组人:王晓春闫瑞娟张泽磊组长:王晓春完成日期:2014.6.25
一.【问题描述】
串是非数值处理中的主要对象,如在信息检索、文本编辑、符号处理等许多
领域,得到越来越广泛的应用。在高级语言中也引入了串数据类型概念,并且串
变量与其他变量(如整型、实型等)一样,可以进行各种运算。
然而,在各种不同类型的应用中,所处理的串有不同的特点,要想有效地实
现串的处理,就必须熟悉串的存储结构及其基本运算。本课程设计的目的就是熟
悉串类型的实现方法和文本模式匹配方法,熟悉如何利用模式匹配算法实现一般
的文本处理技术。
本课程设计分两步:首先,设计出串定位算法(即模式匹配算法)及其实现;
然后,再利用串定位算法设计文本文件的检索及单词的计数等操作。
二.【设计需求及分析】
1.设计要求
1.1串模式匹配算法的设计要求
在串的基本操作中,在主串中查找模式串的模式匹配算法——即求子串位置
的函数Index(S,T),是文本处理中最常用、最重要的操作之一。
所谓子串的定位就是求子串在主串中首次出现的位置,又称为模式匹配或串
匹配。模式匹配的算法很多,在这里只要求用最简单的朴素模式匹配算法。该算
法的基本思路是将给定子串与主串从第一个字符开始比较,找到首次与子串完全
匹配的子串为止,并记住该位置。但为了实现统计子串出现的个数,不仅需要从
主串的第一个字符位置开始比较,而且需要从主串的任一给定位置检索匹配字符
串,所以,首先要给出两个算法:
1.标准的朴素模式匹配算法
2.给定位置的匹配算法
1.2文本文件单词的检索与计数的设计要求
要求编程建立一个文本文件,每个单词不包含空格且不跨行,单词由字符序
列构成且区分大小写;统计给定单词在文本文件中出现的总次数;检索输出某个
单词出现在文本中的行号、在该行中出现的次数以及位置。
该设计要求可分为三个部分实现:其一,建立文本文件,文件名由用户用键
盘输入;其二,给定单词的计数,输入一个不含空格的单词,统计输出该单词在
文本中的出现次数;其三,检索给定单词,输入一个单词,检索并输出该单词所
在的行号、该行中出现的次数以及在该行中的相应位置。
1.建立文本文件
2.给定单词的计数
3.检索单词出现在文本文件中的行号、次数及其位置
4.主控菜单程序的结构
2.概要设计示例如下:
2.6算法设计
朴素模式匹配算法
该算法的基本思想是:设有三个指针——i,j,k,用i指示主串S每次开始
比较的位置;指针j,k分别指示主串S和模式串T中当前正在等待比较的字符位
置;一开始从主串S的第一个字符(i=0;j=1)和模式T的第一个字符(k=0)比
较,若相等,则继续逐个比较后续字符(j++,k++)。否则从主串的下一个字符(i++)
起再重新和模式串(j=0)的字符开始比较。依此类推,直到模式T中的所有字
符都比较完,而且一直相等,则称匹配成功,并返回位置i;否则返回-1,表示
匹配失败。
顺序串的模式匹配算法如下:
intindex(SStringS,SStringT)
{//求子串T在主串S中首次出现的位置
inti,j,k,m,n;
m=T.length;//模式串长度赋m
n=S.length;//目标串长度赋n
for(i=0;i=n-m;i++)
{
j=0;k=i;//目标串起始位置i送入k
while(j=ms.ch[k]==t.ch[j])
{k++;j++;}//继续下一个字符的比较
if(j==m)//若相等,则说明找到匹配的子串,返回匹配位置i,
//否则从下一个位置重新开始比较
returni;
}//endfor
您可能关注的文档
- 八年级数学上册第十四章整式的乘法与因式分解基础过关卷单元测试卷含解析新版新人教版.pdf
- 2022部编版二年级上册道德与法治期末测试卷【基础题】.pdf
- 2023年中级注册安全工程师之安全生产法及相关法律知识通关题库(附带答案).pdf
- (精华版)国家开放大学电大专科《中国当代文学》网络课形考任务4题库及答案.pdf
- 影响数学学习的因素分析.pdf
- 世界各国中英文对照表.pdf
- 北京市丰台区2020-2021学年七年级上学期期末数学试题.pdf
- 财经应用文总结.pdf
- 小学教师晋升职称答辩题.pdf
- 2022~2023消防职业技能鉴定考试题库及答案参考58.pdf
- 学校开展教研活动工作总结.pdf
- 北京市大兴区2019届高三第一学期期末检测理科数学试题(解析版).pdf
- 2023年一建《 建设工程项目管理》真题(含答案).pdf
- 2021年(更新版)国家开放大学电大专科《建筑构造》形考任务2、形考任务3答案.pdf
- 陕西省西安市西北工业大学附中2022-2022年初三10月月考物理试卷在线练习.pdf
- 2022年电子科技大学(沙河校区)护理学专业《病理学》科目期末考试卷B.pdf
- 电工基础学习指导.pdf
- 2022~2023自考专业(小学教育)考试题库及答案第122期.pdf
- 天津人教版七年级下数学练习题.pdf
- 2022-2023学年甘肃省兰州市第五十三中学高三上学期第一次模拟考试数学(理科)试卷.pdf
最近下载
- 一年级数学起步,玩中学不焦虑——2025秋家长培训发言稿.pptx VIP
- 保险学(第五版)课件全套魏华林第0--18章绪论、风险与保险---保险市场监管、附章:社会保险.pptx VIP
- 电力市场的原理、变革与关键问题(41页).pptx VIP
- 《康复评定技术》课件——第五章 言语功能评定技术.ppt VIP
- 电子产品维修技术中职全套教学课件.pptx
- 化妆师理论知识考试模拟试卷及答案.docx VIP
- 《康复评定技术》课件——第三章 心肺功能评定技术.ppt VIP
- 2023年CSP-S组(提高组)初赛真题(文末附答案).pdf VIP
- DB53_T 1097-2022 受污染耕地严格管控技术规范.docx VIP
- 2021年一级建造师市政李四德-锦囊妙计.pdf VIP
文档评论(0)