- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
摘要
摘 要
在机器学习理论中支持向量机(SVM)有着重要的地位,无论是求解分类问题还是求解回归问题,SVM都有着广泛的应用。本文简单的介绍了SVM的基本原理,讨论了SVM在文本分类中的应用,并详细的分析了如何利用SVM构造文本分类器。这里说明了文本分类的详细处理过程,并介绍了这些过程中的关键技术,如:分词技术、向量空间模型(VSM)、特征选取技术和SVM的交叉验证技术等等。结合着分析和讨论又概略的说明了利用Microsoft Visual C++ 6.0创建文本分类系统的过程,介绍了重要的类和关键处理函数的实现和优化,以及如何利用动态链接库来实现C++到Java的迁移。最后给出了由本系统得到的实验数据和结论。
关键字: 机器学习 文本分类 支持向量机(SVM)
ABSTRACT
ABSTRACT
Support Vector Machines (SVM) has an important position in Machine learning theory, whether it is to solve the classification problem or request for the reunification issue, SVM has a wide range of applications. In this paper, a short introduction into the basic principles of SVM, a detailed discussion of the SVM in the text classification, and a careful analysis of how to make use of SVM to construct classifier for a text classification. Heres the text of the detailed classification process and introduced in the course of these key technologies, such as: segmentation technology, vector space model (VSM), features selection technology, cross-verification technology of the SVM and so on. With the analysis and discussion also briefly described the process of making use of Microsoft Visual C++ 6.0 to create the text classification system, introduced the realization and optimization of the key class and important functions, and how to use of dynamic link library to achieve the migration from C++ to Java. Finally, the experimental data and conclusions produced by this system are shown.
Keywords: machine learning text classification SVM(support vector machine)
目录
目录
目 录
TOC \o 1-3 \h \z \u HYPERLINK \l _Toc201329074 第一章 引言 PAGEREF _Toc201329074 \h 1
HYPERLINK \l _Toc201329075 1.1 总体项目背景 PAGEREF _Toc201329075 \h 1
HYPERLINK \l _Toc201329076 1.1.1 基于Web的信息集成??统 PAGEREF _Toc201329076 \h 1
HYPERLINK \l _Toc201329077 1.1.2 基于Web的信息集成系统的需求和系统结构 PAGEREF _Toc201329077 \h 2
HYPERLINK \l _Toc201329078 1.2 文本分类系统的任务和目标 PAGEREF _Toc201329078 \h 3
HYPERLINK \l _Toc201329079 1.3
您可能关注的文档
- Mybatis基础概念.ppt
- 【导与练】2016届高考地理二轮复习第一部分自然地理专题四地表变化规律概念.ppt
- 【导与练】(新课标)2016届高三数学一轮复习第1篇第3节简单的逻辑联结词、全称量词与存在量词理概念.ppt
- mv-chp01概论概念.ppt
- W361814230520水力学探索.doc
- 【导与练】(全国I卷)2017年高考物理一轮复习第2章相互作用实验3验证力的平行四边形定则概念.ppt
- 人教版一年级上册数学教案探索.doc
- WAF技术培训探索.pptx
- Multisim2001概念.ppt
- wav声音文件探索.docx
- GRP点现场测设概念.ppt
- 【创新设计】2014-2015学年高中化学2-1-1化学键与化学反应中的物质变化鲁科版必修2概念.ppt
- MS-EEPO有效教育学习方式训练之约定概念.ppt
- 【成才之路】2015-2016学年高中数学人教B版选修1-1圆锥曲线与方程章末归纳2概念.ppt
- 【成才之路】2015-2016学年高一物理人教版必修1:第3章4《力的合成》概念.ppt
- 【测控指导】2015-2016学年高中语文小狗包弟鲁人版必修4概念.ppt
- Graf法髋关节超声检查概念.ppt
- WI-D-0004DIP品质管理考核标准(A2)探索.docx
- 【测控设计】2015-2016学年高中语文第一单元动人的北平新人教版选修《中国现代诗歌散文欣赏》概念.ppt
- 【测控设计】2015-2016学年高中语文第四单元河床新人教版选修《中国现代诗歌散文欣赏》概念.ppt
最近下载
- 基坑支护内支撑梁拆除施工方案.docx VIP
- 最新人教版一年级上册《数学游戏》课件(整套)教学PPT(2024年秋-新教材).pptx VIP
- 最新人教版一年级数学上册《数学游戏》教学课件(整套)PPT(2024秋-新教材).pptx VIP
- GBT6058-2005 纤维缠绕压力容器制备和内压试验方法.pdf
- GB╱T 23711.1-2009 氟塑料衬里压力容器电火花试验方法.pdf
- 7m焦炉推焦车的结构特征.pdf
- 研发领料单模板.docx VIP
- 辽宁省技工学校审批表.doc VIP
- GB 26501--2011 氟塑料衬里压力容器 通用技术条件.pdf
- 施工放样报验单.doc VIP
文档评论(0)