深度学习在文本挖掘中的应用研究应用数学专业论文.docxVIP

深度学习在文本挖掘中的应用研究应用数学专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
深度学习在文本挖掘中的应用研究应用数学专业论文

⑧ ⑧ 分类号Q2鱼 学校代码 lQ!圣鱼 I C S 学 号 垫12Q塑ZZ 篱=萋~茎 一号 萋 肉 蒙名民庆大学 硕士学位论文 深度学习在文本挖掘中的应用研究 Application of deep learning in Text Mining 申请人: 王郝日钦 学科专业: 应用数学 研究方向: 优化理论、方法及应用 学位类别: 学术学位 指导教师: 裴志利教授 论文提交日期:二。一五年五月 万方数据 摘 摘 要 21世纪的时代是信息的时代,随着计算机技术、数据存贮技术日新月异的发展和 改进,应用领域也得到了快速扩展,世界也随着信息的大量涌入而发生着天翻地覆的 变化,文本数据资源正以指数级的速度增长着.对于许多用户来说面对如此大量的文 本信息,但知识却相对贫乏的现象,人们从大量的信息中获取有意义的、相关性强、 具有针对性的知识变得困难,所以将文本信息按照某些主题分类是一个迫切需要解决 的问题,也是文本数据存储发展的必经之路. 从文本挖掘由美国学者H.P.Luhn教授在1957年第一次被提出来以来,现今文本 挖掘已经成为数据挖掘领域非常重要的一个分支,它已经广泛的应用在搜索引擎等领 域。文本挖掘中特征选择这一过程,可以理解为是一个通过降低了特征空间的维数, 从而来实现提高分类算法精度的重要的过程.因此寻找优秀的特征选择方法来对特征 空间进行降维,现如今己是一个非常有实际价值的研究课题.下面是本文所做的主要 工作: 首先,对文本挖掘的相关技术:文本挖掘的定义和过程,文本挖掘预处理,常用 的文本分类器进行了介绍分析,也介绍了分类结果的评判标准和常用的语料数据集, 在后续试验中应用这些技术将文本数据转换成计算机可处理的数据结果.并且介绍了 深度学习的产生发展经历及其常用的深度学习算法. 其次,提出了基于多个自动编码器(Autoencoder)的文本分类方案,并与单个 AE进行分类的方案进行了理论分析,进行了相应范围内的实验,给出了对比分析. 最后,提出了基于RBM的文本分类方法,进行了相应范围内的实验,给出了基 于RBM算法的文本分类方法精确度与基于KNN算法的文本分类方法精确度的对比分 析结果和结论. 关键词:文本分类;深度学习;文本特征;特征提取;自编码器网络 万方数据 Feature Feature Selection Methods in Text Mining Abstract The twenty—first Century is the age of digital information.With the rapid development of computer technology and data storage technology,applications have been rapidly gaining, text data resources is growing at an exponential pace.For user,facing such massive text messages with poor knowledge,it is difficult to obtain full meaning and high relevant information.Text classification accordance with the contents or theme is an urgent problem to be solved,but also the only way for the development of text data stored.From the text classification has been proposed by American scholar Professor H.P.Luhn in 1 957 for the first time,the text categorization has become a very important branch of data mining.It has been well applied in the search engine field.In text classification,feature selection is a very important process to reduce the dimension of the feature space and improve the classification accuracy.So finding a good feature selection method to reduce the dimensionality o

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档