- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
用C++解决统计字母频率并编码的问题摘 要 本次课程主要解决如何统计一段英文中各字母出现的频率,并用哈夫曼树进行编码的问题。在课程设计中,系统开发平台为Windows XP,程序设计语言采用Visual C++,程序运行平台为Windows XP。在本程序中,任意输入一段长度有限的英文,程序将自动统计其中各字母出现的次数并计算其在整个英文中的频率。然后应用哈夫曼树原理对各字母及相应的频率进行优化编码。在设计过程中,采用了面向对象的设计方案解决问题的方法。在编码完成后,程序通过调试运行,初步实现了设计目标,基本上达到了设计要求。并且经过适当完善后,可以应用到其它关键领域。关键词 程序设计;数据结构;统计次数;频率;哈夫曼;C++;编码1引言针对当前我国高等教育的发展形势以及为了适应21世纪人才培养的需要,培养具有特色的计算机人才,学生在校期间的课程设计项目已变成一个重要的教育手段。学生在课程设计的过程中,既可以学到新的知识,又可以增加本身的动手能力,以学生自己的求学,代替老师的讲学。因此,课程设计对于深化我国高等学校的教学改革是一件十分有意义的事。这次的课程设计主要解决如何统计一段英文中各字母出现的频率,并用哈夫曼树进行编码的问题。在程序设计的初期,构思用何种数据结构保存数据,用什么算法进行统计计算是一个非常重要的问题。经过反复思考筛选,得到本程序的数据结构。在程序开发设计过程中,本人选择系统开发平台为Windows XP,程序运行平台为Windows XP.设计语言采用Visual C++。在程序开发中期,如何进行函数之间的参数传递,采用何种方式传递,怎样精程序实现步骤,也耗费了开发者相当长的时间。最后的调试运行,是最艰难的工作。选择边缘数据进行调试是调试程序的一般方法,该程序也采用此方法。经过初步的调试运行,基本实现要设计要求。并且在得到适当的完善后,可以运用于其它关键领域。 计算机在进行编码时,有等长编码和不等长编码两种。等长编码对于使用频率相同的字符来说,具有节省空间的好处。如果字符的使用频率大不相同,则使用不等长编码。哈夫曼树对于不等长编码,具有非常大的优势,对于出现频率高的字符,尽量采用长度短的编码,对于出现频率较高的字符,可适当采用较长的编码。这样,会获得很好的空间效率。这个思想是今天广泛使用的文件压缩技术的核心。在程序中主要设计的两个基本功能,分别为统计功能和编码功能。任意输入一段长度有限的英文,程序中会自动统计其中各个字母出现的次数,并计算其在整个英文中的频率。然后将计算结果传递给编码函数,编码函数根据哈夫曼树原理对各个字母及其相应的频率进行优化编码。最终结果保存在程序设计初期设计的数据结构数组中,便于文件压缩保存。本程序经规划、设计、编码到运行实现,无一不渗透着制作者辛劳的汗水。但由于本人经验和学识有限,定有很多不足之处,希望能得到各位老师以及其他高手的指教修订,使程序不断完善。2设计思路与方案2.1 课程设计目的在进行程序设计或者通信时,经常通过给每一个字符标记一个单独的代码来表示一组字符,我们称之为编码。例如,标准ASCII码把每个字符分别用一个7位的二进制数表示,这种方法使用最少的位表示了所有ASCII码中的128个字符。假设所有代码都等长,则表示n个不同的字符需要[log2n]位,这称之为等长编码。如果每个字符的使用频率相等,等长编码是空间效率最高的方法。如果字符出现频率不同,则等长编码则会浪费大部分的空间。为了能更好地节资源及空间,可以采用不等长编码。本课程采用的是哈夫曼树编码2.2 课程设计原理对于不等长编码,如果设计得不合理,可能出现多种译码方式,会给译码带来困难。因此,设计不等长编码时,还必须考虑译码的惟一性。如果一组编码中任一编码都不是其他任何一个编码的前缀,我们称这组编码为前缀编码(prefix code).前缀编码保证了编码被解时不会有多种可能。哈夫曼树可用于构造最短的不等长编码方案,具体做法如下:设需要编码的字符集合为{d1,d2,…,dn},它们在字符串中出现的频率为{w1,w2,…,wn},以d1,d2,…,dn作为叶子结点,w1,w2,…,wn作为叶子结点的权值,构造一棵哈夫曼编码树,规定只夫曼编码树的左分支代表0,右分支代表1,则从根结点到每个叶子结点所经过的路径组成的0和1的序列便成为该叶子结点对应字符的编码,称为哈夫曼编码。在哈夫曼编码树中,树的带权路径长度的含义是各个字符的码长与其出现次数的乘积之和,所以采用哈夫曼树构造的编码是一种能便字符串的编码总长度最短的的不等长编码。由于哈夫曼编码树的每个字符结点都是叶子结点,它们不可能在根结点到其它字符结点的路径上,所以一个字符的哈夫曼编码不可能是另一个字符的哈夫曼编码的前缀,从而保证了译码的惟一性。2.3 课程设计内容
您可能关注的文档
最近下载
- 人教版-小升初考试数学专题讲练:第21讲 植树问题.doc VIP
- 影棚及摄像器材租赁报价单.pdf
- 应用博弈论解决海盗分金问题.pptx VIP
- 2025年高考天津卷作文“车轮辐辏”审题立意及范文 .pdf
- 挖掘红色资源开发校本课程图文.pdf VIP
- 围手术期预防应用抗菌药物专项点评及干预效果分析.doc VIP
- 建筑施工危险源辨识及风险评价清单500项.pdf VIP
- 四川成都高新科技创新投资发展集团有限公司招聘笔试题库2025.pdf
- IATF16949--过程审核检查表-(含审核记录)-.pdf VIP
- 2026西南证券股份有限公司校园招聘300人考试备考试题及答案解析.docx VIP
原创力文档


文档评论(0)