- 3
- 0
- 约8.93千字
- 约 10页
- 2019-07-03 发布于浙江
- 举报
2011-2012年数据结构
课程设计实验报告
学院:
班级:
姓名:
学号:
邮箱:
2012年1月5日
《课程设计》实验报告
班 级: 学 号: 姓 名:
E-mail: 日 期:
◎实验题目: 字典树
◎实验目的:设计合适的数据结构,建立字典树,解决文件中单词的搜索统计问题。
◎实验内容:现在有一个英文字典(每个单词都是由小写的a-z组成),单词量很大,达到100多万的单词,而且还有很多重复的单词。
此外,我们现在还有一些 Document,每个Document 包含一些英语单词。
针对这个问题,请你选择合适的数据结构,组织这些数据,使时间复杂度和空间复杂度尽可能低,并且解决下面的问题和分析自己算法的时间复杂度。
1)基本型问题
(1)选择合适的数据结构,将所有的英文单词生成一个字典Dictionary。
(2)给定一个单词,判断这个单词是否在字典 Dictionary中。如果在单词库中,输出这个单词总共出现的次数。否则输出NO。
2)扩展型问题
(3)给定一个单词,按字典序输出字典 Dictionary 中所有以这个单词为前缀的单词。例如,如果字典 T={a,aa, aaa, b, ba}, 如果你输入 a,那么输出应该为{a, aa, aaa}。
(4)给定一个单词,输出在Dictionary 中以这个单词为前缀的单词的出现频率最高的10个单词,对于具有相同出现次数的情况,按照最近(即最后)插入的单词优先级比较高的原则输出。
(5)输出Dictionary中出现次数最高的10个单词。
3)高级型问题
(6)现在我们有一些Document,每个Document 由一些单词组成,现在的问题就是给你一个word,检索出哪些 Document包含这个 word,输出这些Document的DocumentID(就如同搜索引擎一样,即输入一些关键字,然后检索出和这些关键字相关的文档)。
(7)在第(6)问中,我们只考虑了一个word 在哪些Document中的情况,我们进一步考虑2个相邻word的情况,检索出同时包含这两个相邻word的DocumentID。
4)挑战型问题
(8) 现在我们再对(7)的问题进行扩展,把(7)中的只检索相邻 2个word 推广到可以检索多个word(即连续的k个word,其中k=2),检索出同时包含k个连续word 的DocumentID。
我解决了前六个问题。
一、需求分析
1.本程序演示中,程序自动读取目标文件,生成需要的文件。
2. 演示程序以用户和计算机的对话方式执行,即在计算机终端上显示“提示信息”之后,由用户在键盘上输入相应数据。
3.程序执行的主要命令包括:
(1)构建栈;(2)构造字典树;(3)构建文件数;(4)树的查找;(5)结束。
二 概要设计
为实现上述算法,选择字典树为本程序的存储结构。
1、本程序包括三个模块:
(1)主程序模块;
(2)构建栈模块;
(3)构造字典树模块;
(4)构建文件数模块;
(5)树的遍历模块;
2、模块调用关系图
主程序模块
构建栈模块
构造字典树模块
构建文件数模块
树的遍历模块
三 详细设计
1、定义存储链表结构:
(1)定义字典树与文件数结构:
#includestdio.h
#includestring.h
#includestdlib.h
#includemalloc.h
#define NULL 0
#define ERROR -1
#define stack_in_size 100
#define stackincrement 10
struct TreeNode /*树结点*/
{
char ch;
int number; /*以该字符为结束的单词出现的个数*/
struct TreeNode* pt[26]; /*指向后继的字母的26个指针*/
};
struct TreeNode *root;
typedef struct TreeNode *Link_TreeNode;
struct MAX_TEN /*存放出现频率最高的十个单词数据结构*/
{
char STRING[35];
int count; /*字符串出现的次数*/
int xiabao; /*字符数组位置的下标*/
};
struct MAX_TEN MAX[10];
struct MAX_T
您可能关注的文档
最近下载
- ATS-2AO模拟音频分析仪用于生产测试与广播.pdf
- 基于数学模型的疫苗接种策略分析.docx
- 医学科研关键词中英文对照手册(权威版).docx VIP
- 最新国家开放大学电大本科《工程经济与管理》期末试题标准题库及答案.docx VIP
- 广工EDA实验报告.docx VIP
- 国家开放大学电大本科《工程经济与管理》2025-2026期末试题及答案(试.docx VIP
- 国家开放大学电大本科【工程经济与管理】2025-2025期末试题及答案(试.docx VIP
- 技嘉 主板 Socket 1150 GA-Z97X-Gaming 7 (rev. 1.0) 使用手册.pdf
- 广东省东莞市2023-2024学年高一上学期语文期末教学质量检测试卷 解析版.docx VIP
- 广东省东莞市2022-2023学年高一上学期语文1月教学质量检查(期末)试卷(含答案).pdf VIP
原创力文档

文档评论(0)