竞争情报系统中一种自动文本分类策略 - 图书情报工作.pdf

竞争情报系统中一种自动文本分类策略 - 图书情报工作.pdf

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
竞争情报系统中一种自动文本分类策略 - 图书情报工作

>> 第56卷 第24期 2012年12月   竞争情报系统中一种自动文本分类策略 ———以民用航空客服行业为例        秦宝宝 宋继伟 董 尹 牛 青 吕美香 陈 彬 李 骁 南京大学信息管理学院 南京210093 〔摘要〕将自动文本分类引入竞争情报系统,并结合民航客服业的实际应用场景展开研究。在对文本分类的理论 基础进行研究与分析的基础上,设计一种自动分类策略,其核心是针对传统机器学习方法依赖历史数据的局限, 优化特征选择和学习样本获取方法。选用SVM算法,详细描述分类词表构建、分类规则提取、分类模型训练等过 程,最终取得较为理想的实际效果。 〔关键词〕自动文本分类 竞争情报系统 民用航空 客户服务 支持向量机 〔分类号〕G354 AStrategyofAutomaticTextCategorizationinCompetitiveIntelligenceSystem:TakingCivilAviation CustomerServiceIndustryasanExample QinBaobao SongJiwei DongYin NiuQing LüMeixiang ChenBin LiXiao SchoolofInformationManagement,NanjingUniversity,Nanjing210093 〔Abstract〕Thispaperfocusesontheapplicationofautomatictextclassificationinthecompetenceintelligencesystem(CIS)basedon thepracticalapplicationscenarioofthecivilaviationindustry.Afterresearchingandanalyzingthetheoreticalbasisofautomatictext classification,itdesignsanewstrategy.Traditionalmachinelearningmethodreliesonthehistoricaldataheavily,whichmakesthe processcomplex.Thispaperoptimizesthemethodoffeatureselectionandillustrateshowtoobtainlearningsamples.UsingSVMasthe corealgorithm,itgivesadetaileddescriptionoftheprocessofclassificationvocabularybuilding,classificationrulesextracting,classi ficationmodeltraining,andultimatelyachievesasatisfactorypracticaleffect. 〔Keywords〕automatictextclassification competitiveintelligencesystem CIScivilaviation customerservice SVM 工作人员造成很大的负担。为了更加有效地查找、过 1 引 言 滤和组织复杂的海量情报信息,分类必须成为竞争情 报的一项重要工作内容。因此,综合应用计算机自动   自动文本分类是指计算机根据预先设置的分类体 化技术,研究和实现竞争情报系统的自动分类功能就 系为文本指定类别,它方便用户快速定位所需的有效 成了一项迫切的需求。 信息,同时克服了传统的人工分类诸如分类周期长、费   本文中的竞争情报系统以民航客服行业为背景, 用高、效率低的缺点,已成为一项具有较大使用价值的 自动文本分类是本系统的关键模块之一。但是在开发 关键技术。文本分类在自然语言处理与理解、信息组 过程中发现,虽然一些算法在实验环

您可能关注的文档

文档评论(0)

wujianz + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档