《大数据架构与设计》课程报告讲解-歌词生成大数据系统.pptxVIP

《大数据架构与设计》课程报告讲解-歌词生成大数据系统.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

网易云的歌词生成

目录CONTENTS02歌词清洗和特征提取0103算法设计可视化展示

设计思路爬取网易云歌词歌词清洗和特征提取歌词生成可视化展示

01歌词清洗和特征提取

爬取歌词0101歌词清洗和特征提取

清洗代码0201歌词清洗和特征提取获取爬取歌词去除时间标签,分行去除无效信息

清洗结果0301歌词清洗和特征提取

0401歌词清洗和特征提取词频统计数据集上传HDFS集群执行任务

0501歌词清洗和特征提取获取HDFS文件RDD词频统计统计代码

0601歌词清洗和特征提取词云图

02算法设计

02算法设计char-RNN原理01基本原理:以要让模型学习写出“hello”为例,Char-RNN的输入输出层都是以字符为单位。输入“h”,应该输出“e”;输入“e”,则应该输出后续的“l”。

02算法设计基于char-RNN的歌词生成02基本原理:每个字与每个字并不是统计上独立的,比如说:如果不爱就不要再伤害是长度为10的序列,如果我们知道如,下一个字就可能是果;如果知道前两个字是如果,第三个字就是不得可能性大一些;依此类推,如果知道前九个字是如果不爱就不要再伤,那么最后一个字就是害。如果果不不爱爱就就不不要要再再伤伤害

02算法设计char-RNN生成文本得过程03在预测的时候需要给网络一段初始得序列进行预热,预热的过程并不需要实际的输出结果,只是为了生成具有记忆的隐藏状态,然后将隐藏状态保留,传入之后的网络,不断的更新句子,直到达到输出的长度。生成文本的过程就是每个字不断输入网络,然后将输出作为下一次的输入,不断循环递归,因为会不断循环下去,所以可以设置一个长度让其停止。

02算法设计训练04

03可视化展示

生成歌词0103可视化展示

生成歌词0103可视化展示

生成周杰伦风格歌词0203可视化展示

生成陈奕迅风格歌词0203可视化展示

谢谢观看

文档评论(0)

浙江工程信息通 + 关注
实名认证
服务提供商

网络工程师持证人

本人已从事浙江省工程咨询5年,对浙江省内工程信息非常熟悉,可获取新建工程相关联系人、设计院、业主等关键信息。另外从事楼宇自控专业已10年,考取了一建二建等资格证书,有关考试方面的问题(考试心得、方法、学习资料等)都欢饮来咨询交流。

领域认证该用户于2023年05月11日上传了网络工程师

1亿VIP精品文档

相关文档