- 37
- 0
- 约1.29万字
- 约 15页
- 2019-02-20 发布于广东
- 举报
文本文件单词的检索与计数
专业:软件工程 班级: 1227班 姓名: 王晓春 学号: 2012005774
同组人:王晓春 闫瑞娟 张泽磊 组长:王晓春 完成日期: 2014.6.25
一.【问题描述】
串是非数值处理中的主要对象,如在信息检索、文本编辑、符号处理等许多
领域,得到越来越广泛的应用。在高级语言中也引入了串数据类型概念,并且串
变量与其他变量 (如整型、实型等)一样,可以进行各种运算。
然而,在各种不同类型的应用中,所处理的串有不同的特点,要想有效地实
现串的处理,就必须熟悉串的存储结构及其基本运算。本课程设计的目的就是熟
悉串类型的实现方法和文本模式匹配方法,熟悉如何利用模式匹配算法实现一般
的文本处理技术。
本课程设计分两步:首先,设计出串定位算法 (即模式匹配算法)及其实现;
然后,再利用串定位算法设计文本文件的检索及单词的计数等操作。
二.【设计需求及分析】
1.设计要求
1.1串模式匹配算法的设计要求
在串的基本操作中,在主串中查找模式串的模式匹配算法——即求子串位置
的函数Index(S,T),是文本处理中最常用、最重要的操作之一。
所谓子串的定位就是求子串在主串中首次出现的位置,又称为模式匹配或串
匹配。模式匹配的算法很多,在这里只要
原创力文档

文档评论(0)