Python语言程序设计-课后练习-第6周.pdfVIP

Python语言程序设计-课后练习-第6周.pdf

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Python语言程序设计-课后练习-第6周

    中国大学MOOC课程  《Python语言程序设计》  课后练习(第6周)      北京理工大学  Python语言教学团队    第 1 页/共 8 页     【说明】  本文是中国大学 MOOC 课程《Python 语言程序设计》第 6 周的课 后练习,预估学习完成时间约 50 分钟。 本周课后练习内容包括 3 道编程题,帮助同学学习文件读写和字 典操作。 对于尚未安装 Python 运行环境的同学,请根据第 1 周课程内容介 绍的步骤安装 Python 3.5.1 或者 Python 3.5.2 版本解释器,如果操作系 统兼容性有问题,可以安装 Python 3.4 版本解释器。 第 2 页/共 8 页 【课后练习】  1. 理解文本和二进制打开方式的区别 首先,用文本编辑器生成一个包含“中国是个伟大国家!”的 txt 格式文本文件,命名为 test.txt。编写程序分别用文本文件方式和二 进制文件方式读入,并打印输出效果。 观察输出结果并解释。 2. 文件处理 fo = open(fname, r) for line in fo: # 处理一行数据 fo.close() 上述格式是打开文件并逐行处理的程序框架,请编写一个实例练习。 3. 哈姆雷特词频统计 Hamlet,《哈姆雷特》,是莎士比亚的一部经典悲剧作品,讲述了克 劳狄斯叔叔谋害哈姆雷特父亲并篡取王位、哈姆雷特流浪在外并向叔 叔复仇的故事。《哈姆雷特》也叫《王子复仇记》,代表着整个西方文 艺复兴时期文学的最高成就,很多国内外电影都以这个故事为原型。 获取该故事的文本文件,保存为 hamlet.txt。全文可以从 MOOC 课程 下载或从网络获得。 统计 Hamlet 英文词频的第一步是分解并提取英文文章的单词。同 第 3 页/共 8 页 一个单词会存在大小写不同形式,但计数却不能区分大小写。假设 Hamlet 文本由变量 txt 表示,可以通过 txt.lower()函数将字母变成 小写,排除原文大小写差异对词频统计的干扰。英文单词的分割可以 是空格、标点符号或者特殊符号。为统一分隔方式,可以将各种特殊 字符和标点符号使用txt.replace()方法替换成空格,再提取单词。 统计词频的第二步是对每个单词进行计数。假设将单词保存在变量 word 中,使用一个字典类型 counts={},统计单词出现的次数可采用 如下代码: counts[word] = counts[word] + 1 当遇到一个新词时,单词没有出现在字典结构中,则需要在字典中 新建键值对: counts[new_word] = 1 因此,无论词是否在字典中,加入字典 counts 中的处理逻辑可以 统一表示为: if word in counts: counts[word] = counts[word] + 1 else: counts[word] = 1 或者,这个处理逻辑可以更简洁的表示为如下代码: counts[word] = counts.get(word,0) + 1 字典类型的counts.get(word,0)方法表示:如果word在counts中, 则返回word对应的值,如果word 不在counts 中,则返回 0。 该实例的第三步是对单词的统计值从高到低进行排序,输出前 10

文档评论(0)

138****7331 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档