数据结构大作业要求1.0.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据结构大作业要求1.0

数据结构大作业要求1. 0 【题目】 Given a set of files, of which the sizes will not exceed 10 Gigabytes, find out whether an input string appears or not. Your program is judged based on correctness and searching time. Your program is allowed some preparation time no longer than one hour. 【具体要求】 1、题目及示例: 给定几个目标字符串和一系列文件,判断每个字符串分别在哪些文件中出现 过。 给定的文件格式如下: target.txt:需要寻找的字符串 N (需要寻找的字符串个数) 目标字符串,每个字符串一行 filename.txt:需要搜索的文件的文件名 M (文件个数) 各个文件名,所有文件名都是“数字.txt的格式,而且都是按1、2、3、4的顺 序排列的 文件名.txt:需要被搜索的文件,每个里面都是一个很长的字符序列 字符序列 结果写入到output.txt中 分成N行写,N是需要寻找的字符串个数。 第k行写出第k个字符串所在的文件名,文件名按从小到大排列,不用写.txt, 文件名之间用空格隔开 例如: target.txt 2 abc \5a filename.txt 3 1.txt 其中,被搜索的文件名都是以“数字.txt”的格式命名的。 被搜索的文件中,所有char型的字符都有可能出现。要搜索的目标字符串中 的字符都在ASCII码表中32到126的范围内,即只包括可以正常显示的字符和 空格。 搜索时必须完全一样才能认为字符串存在。 例如,要搜索abc,文件中出现ab c或者ab c等等都不代表abc存在。 2、程序说明 可以写成两个程序来完成任务,即“预处理程序”和“主程序”。“预处理程 序”不能读取target文件,“主程序”可以读取所有的文件。即“预处理程序” 不知道要搜索的是哪些字符串,只能从要搜索的文件中提取可用信息。“预处理 程序”可以把获得的有用信息写到一些临时文件中,之后“主程序”再从中读取 并利用。最后由“主程序”的运行时间来给分,“预处理程序”的时间不能超过 一个小时。“预处理程序”的运行时间到达1个小时的时候会被强行终止。“预处 理程序”并不是必要的,可以不写“预处理程序”,只写“主程序”。 1.txt: Asdfg hjkld 2.txt: dfghjabc 3.txt 2f\5abc3 可以看出2.txt和3.txt中都包含有字符串abc,3.txt中包含字符串\5a,所以 output.txt中的结果是 3 2 3 程序运行过程中对于给出的txt文件(filename.txt,target.txt,要搜索的文件) 只许读,不允许写和更改,如果试图写入或更改这些txt文件,程序会崩掉。 程序运行过程中如果需要建立一些临时文件,请在文件名中加入学号,这样 做是为了防止不同的同学用了同样的文件名导致冲突。在程序运行完毕后请删掉 临时文件,只保留output.txt文件。 3、测试方法 附件中已上传测试程序,测试方法如下。 将“预处理程序”的exe文件命名为pre学号.exe,将“主程序”的exe 文件命名为学号.exe。把两个exe文件,大作业测试.bat和所有要读取的txt 文件放到一个文件夹下。双击大作业测试.bat即可。 例如,学号为2008011101,则两个exe文件分别为pre2008011101.exe,和 2008011101.exe。双击大作业测试.bat后,屏幕上会显示运行时间的记录,同 时会生成一个“时间记录.txt”的文档。里面内容如下: 当前运行:2008011101 预处理程序 start: 13:43:14.73 end: 13:43:14.77 主程序 start: 13:43:27.33 end: 13:43:27.35 程序结束后,程序产生的output.txt会被测试程序改成“学号output.txt”, 即会出现2008011101output.txt这个文件。输出文件名一定要写成output.txt。 测试程序在运行“预处理程序”时会对target.txt文件做处理,如果“预处理 程序”试图读取target.txt文件中的内容,程序会崩掉。在运行“主程序”时不 会有这种问题。 在最后测试时会先用一组中小规模的数据进行测试,判断程序是否能正常运 行,结果正确后才进行大规模数据测试。因此,程序应能够合理地判断和处理不 同规模的数据。 最后测试的大数据大致有100到1000个文件,总大小为几个

文档评论(0)

zhanghc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档