- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
深度学习在文本挖掘中的应用研究应用数学专业论文
⑧
⑧ 分类号Q2鱼 学校代码 lQ!圣鱼
I C S 学 号 垫12Q塑ZZ
篱=萋~茎 一号 萋
肉 蒙名民庆大学
硕士学位论文
深度学习在文本挖掘中的应用研究
Application of deep learning in Text Mining
申请人: 王郝日钦 学科专业: 应用数学
研究方向: 优化理论、方法及应用
学位类别: 学术学位
指导教师: 裴志利教授 论文提交日期:二。一五年五月
万方数据
摘
摘 要
21世纪的时代是信息的时代,随着计算机技术、数据存贮技术日新月异的发展和 改进,应用领域也得到了快速扩展,世界也随着信息的大量涌入而发生着天翻地覆的 变化,文本数据资源正以指数级的速度增长着.对于许多用户来说面对如此大量的文 本信息,但知识却相对贫乏的现象,人们从大量的信息中获取有意义的、相关性强、 具有针对性的知识变得困难,所以将文本信息按照某些主题分类是一个迫切需要解决 的问题,也是文本数据存储发展的必经之路.
从文本挖掘由美国学者H.P.Luhn教授在1957年第一次被提出来以来,现今文本 挖掘已经成为数据挖掘领域非常重要的一个分支,它已经广泛的应用在搜索引擎等领 域。文本挖掘中特征选择这一过程,可以理解为是一个通过降低了特征空间的维数, 从而来实现提高分类算法精度的重要的过程.因此寻找优秀的特征选择方法来对特征 空间进行降维,现如今己是一个非常有实际价值的研究课题.下面是本文所做的主要 工作:
首先,对文本挖掘的相关技术:文本挖掘的定义和过程,文本挖掘预处理,常用 的文本分类器进行了介绍分析,也介绍了分类结果的评判标准和常用的语料数据集, 在后续试验中应用这些技术将文本数据转换成计算机可处理的数据结果.并且介绍了
深度学习的产生发展经历及其常用的深度学习算法. 其次,提出了基于多个自动编码器(Autoencoder)的文本分类方案,并与单个
AE进行分类的方案进行了理论分析,进行了相应范围内的实验,给出了对比分析. 最后,提出了基于RBM的文本分类方法,进行了相应范围内的实验,给出了基
于RBM算法的文本分类方法精确度与基于KNN算法的文本分类方法精确度的对比分 析结果和结论.
关键词:文本分类;深度学习;文本特征;特征提取;自编码器网络
万方数据
Feature
Feature Selection Methods in Text Mining
Abstract
The twenty—first Century is the age of digital information.With the rapid development of computer technology and data storage technology,applications have been rapidly gaining, text data resources is growing at an exponential pace.For user,facing such massive text messages with poor knowledge,it is difficult to obtain full meaning and high relevant
information.Text classification accordance with the contents or theme is an urgent problem
to be solved,but also the only way for the development of text data stored.From the text classification has been proposed by American scholar Professor H.P.Luhn in 1 957 for the first time,the text categorization has become a very important branch of data mining.It has been well applied in the search engine field.In text classification,feature selection is a very important process to reduce the dimension of the feature space and improve the classification accuracy.So finding a good feature selection method to reduce the dimensionality o
您可能关注的文档
- web服务技术及其在企业应用集成中的研究管理科学与工程专业论文.docx
- 黏蛋白1在食管鳞癌中的表达及其与临床病理及预后的关系外科学胸外科学专业论文.docx
- 双渠道回购契约协调研究工业工程专业论文.docx
- 布什每周电台演讲的功能文体分析外国语言学及应用语言学专业论文.docx
- 华盛顿传第1923章翻译项目报告英语笔译专业论文.docx
- 3s集成技术在工程项目管理中的应用分析土木工程管理专业论文.docx
- xz卷烟工厂制造过程成本控制即时化系统分析与设计工商管理专业论文.docx
- 对外汉语初级综合课教材练习设置的考察与分析汉语国际教育专业论文.docx
- 苯环5取代磺酰脲类除草剂的合成生物活性及水解研究有机化学专业论文.docx
- 多项选择题和简答题的题目效度对比研究外国语言学及应用语言学专业论文.docx
- 蛋白质组学在筛选肝癌早期诊断血清标志物中的应用研究肿瘤学肿瘤分子病理学专业论文.docx
- 经皮冠状动脉介入治疗术前及术后随访12个月的焦虑抑郁情况研究内科学专业论文.docx
- ttx心脏停搏液对离体鼠心缺血再灌注心肌闰盘蛋白的影响外科学胸心外专业论文.docx
- 大鼠胚胎皮肤无瘢痕性愈合机制的实验研究口腔临床医学专业论文.docx
- 二氧化硅基复合相变储能材料的制备及热性能研究化学工艺专业论文.docx
- 从“科层制”到“一站式”泗阳县行政服务中心发展的策略选择-公共管理;行政管理专业论文.docx
- 初中数学动点型几何问题的教学实践研究学科教学数学专业论文.docx
- 超声造影评价糖尿病肾病肾功能变化的临床研究影像医学与核医学专业论文.docx
- 发达地区大城市流动人口居住状况与规划对策城市规划与设计专业论文.docx
- 低温等离子体发射光谱学研究等离子体物理专业论文.docx
文档评论(0)