数据挖掘与算法-习题与思考答案与提示.pdfVIP

数据挖掘与算法-习题与思考答案与提示.pdf

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

部分习题与思考的答案与提示

第二章习题与思考

1.编程调用栈操作函数压入1000000个随机整数,再全部弹出来,打印花费的总时间。

提示:可以使用clock()函数获取当前时间,在压入数据前调用一次clock(),压入完数据

后再调用一次clock(),两次时间差便是实际花费的总时间。

2.编程将100万个随机整数插入到SortTable中,再调用快速排序函数排序,打印出排序

花费的时间。

提示:参考第1题的提示。

3.编程将1~1000000的整数一次插入排序表里,调用二分查找函数将1100

万个数依次查找一遍,打印出花费的时间。

提示:参考第1题的提示。

4.编码实现动态环形队列DeQue的弹出尾部节点函数DeQue_PopTail()和插入头部

函数DeQue_InsertHead()函数。

提示:参考DeQue_PopHead()和DeQue_InsertTail()的实现。

第三章习题与思考

1.在整块内存链表的实现中,考虑一下如果当自由空间的节点用完时,再插入数据,申请

一块大一倍的内存,将原来内存中数据直接拷贝过去,将多出的一半自由空间加入到自

由空间链表中,此时再插入数据,试问这种实现方式存在什么问题?

提示:申请大一倍的内存后,内存的起始地址和原来内存的起始地址不一样,导致拷贝

完后,链表的链接指向的还是原来那块内存中的内容。

2.编码实现一个整块内存中的链表插入算法,要求实现任意个数节点的插入。

提示:参考第1题。

第四章习题与思考

1.编码将100万个随机整数插入到哈希表中,再将这100万个整数全部查找一遍,看需要

花费多长时间?

提示:可以使用rand()函数来生成随机数,调用rand()函数前需要先调用srand()函数初

始化随机数发生器。

第五章习题思考:

1.证明AVL树中从根节点到任一树梢节点的路径上不存在连续三个树梢节点。

证明:使用反证法,假设存在三个连续的树梢节点,那么这三个连续树梢节点最上面的

那个节点的左右子树高度差将大于等于2,与AVL树的条件矛盾。

2.证明红黑树中从根节点到任一树梢节点的路径上不存在连续三个树梢节点。

证明:使用反证法,假设存在连续三个树梢节点,那么由红黑树的条件知道从根节点到

任一树梢节点路径中的黑色节点数量相等,而从根节点到第2个树梢节点的路径必然要

经过第1个树梢节点,根节点到第3个树梢节点的路径必然经过第2个树梢节点,因此知

道三个树梢节点的第2个和第3个节点必为红色,但这又与红黑树中没有连续两个红色节

点的条件矛盾,因此得证。

3.使用非递归算法编码实现二叉树的前序遍历函数。

答案:见光盘源代码

4.编码实现二叉树的宽度遍历函数。

提示:参考树的宽度遍历算法

5.使用红黑树替代哈希表去实现前面讲过的WebServerCache文件管理功能。

6.比较一下哈希表、AVL树、红黑树在各种操作效率方面的区别。

7.估算一下对一个5000单词的文件进行分词大约需要多少次词典查询?

假设平均每句有10个单词,那么有500句,每句大约耗费10×9/2=45次词典查询,因

此总共需要大约500×45=22500次词典查询。

8.一个企业想建一个内部搜索引擎,假设总共有十万个关键词,十万个网页文件,估算一

下搜索关键词词典大约要占多少内存空间?

答:假设平均每个网页有500个不重复的单词,那么在关键词词典中,每个网页出现的

平均次数为500次;

所有网页在关键词词典中出现总次数为:500×10万次。

每个关键词所对应的网页文件平均个数为:500×10万/10万=500个。

如果给网页文件名编号的话,编号需要消耗4字节,那么一个关键词对应的网页文件列

表就需要消耗:4字节×500=2000字节。

10万个关键词的词典总共需要消耗:10万×2000字节=200M字节。

假设每个网页文件名需要消耗32字节空间,那么

网页文件名和编号表消耗的空间为:10万×(32+4)=3.6M字节

总共需要消耗203.6

您可能关注的文档

文档评论(0)

176****0816 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档