基于概率超图半监督学习的专利文本分类方法研究-论文.pdfVIP

  • 4
  • 0
  • 约2.16万字
  • 约 6页
  • 2017-11-29 发布于湖北
  • 举报

基于概率超图半监督学习的专利文本分类方法研究-论文.pdf

第 35卷 第9期 情 报 杂 志 V0I|35 No.9 2016年9月 JOURNALOFINTELLIGENCE Sep. 2016 基于概率超 图半监督学习的专利文本 分类方 法研 究 刘桂锋 汪满容 刘海军 (江苏大学科技信息研究所 镇江 212013) 摘 要 [目的/意义]提出了一种基于概率超图半监督学习的专利文本分类方法,拓展超图理论的应用领域,丰富 专利文本分类方法体系。[方法/过程]针对 目前基于监督学习的专利文本分类方法存在着依赖大量的训练样本,并 且训练样本的标注费时费力、需要一定技术含量等问题,将基于超图的半监督学习方法引入到专利文本分类中,提 出了一种基于k近邻策略的专利文本概率超图构建方法,并在此基础上给 出了基于超图学习的专利文本 自动分类 算法。该方法可以利用未标记样本提供的样本分布信息来提高分类精度。[结果/结论]实验结果表明,该方法能 够在标记少量训练样本的情况下获得比较理想的分类精度和召回率。 关键词 概率超图 超图学习 半监督学习 专利分类 分类器 中图分类号 G254 文献标识码 A 文章编号 1002—1965(2016)09—0187—05 引用格式 刘桂锋,汪满容,刘海军 .基于概率超图半监督学习的专利文本分类方法研究[J].情报杂志,2016,35 (9):187-191,173. DoI 10.3969/j.issn.1002—1965.2016.09.033 ProbabilisticHypergraphBasedSemi-supervisedLearningMethodfor PatentDocumentCategorization LiuGuifeng WangManrong LiuHaijun (InstituteofScientifieandTechnologicalInformation,JinagsuUniversity,Zhenjinag 212013) Abstract [Purpose/Significance]Thispaperpresentsprobabilistichypergraphbasedsemi-supervisedlearningmehtodforpatenttextcat- egorization,thusexpandstheapplicationfieldsofhypergraphhteorynadenricheshtepatenttextclassificationmehtodsystem.[Method/ Process]Ashteprevioussupervisedlearningforpatenttextclassificationmehtodsdependsonalargenumberoftrainingsamplesnadthe labelingofthetrainingsma plesistime—consumingandrelativelyrequiresmaximum skills,inordertosolvetheaboveproblems,weintro— ducehypergraphbasde semi—supervisde learningmehtodintothefieldsofpatenttextclassification,putofrwradanew mehtodofprobabi— listichypergraphbasedk—neraestneighboralgorihtm forpatenttext,andhtenproposepatenttextautomaticclassificationalgorithm based onh

文档评论(0)

1亿VIP精品文档

相关文档