基于栏目的藏文网页文本自动分类方法.pdfVIP

  • 5
  • 0
  • 约9.74千字
  • 约 4页
  • 2017-08-20 发布于安徽
  • 举报

基于栏目的藏文网页文本自动分类方法.pdf

第25卷第4期 中文信息学报 V01.25,No.4 OFCHINESEINFORMATION Jul.,2011 2011年7月 JOURNAL PROCESSING 文章编号:1003—0077(2011)04—0020—04 基于栏目的藏文网页文本自动分类方法 胥桂仙1’2,向春丞1,翁或1’2,赵小兵1’2,杨国胜1 摘 要:该文提出了一种简单、快速的藏文网页文本分类方法。该方法利用网页栏目中词条的类别特征,结合网页 文本提取技术.实现了快速、精确地将藏文网页文本归于预定义类别中。实验表明,该方法具有很高的网页文拳分 类正确率,对构建高质量多类别藏文语料库有重要作用。 关键词:藏文信息处理;文本分类;藏文网页分类 中图分类号:TP391 文献标识码:A Text ofTibetanWeb AutomaticClassi

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档