基于Session的特征选择.pdfVIP

  • 22
  • 0
  • 约2.92万字
  • 约 12页
  • 2017-08-20 发布于安徽
  • 举报
基于Session的特征选择 陈展文1文继荣2陈泽琳3 l(华南理工大学计算机学院,广州510640) 2(微软亚洲研究院多媒体管理组,北京,100080) 3(华南理工大学计算机学院,广州510640) 摘要:随着网络技术的发展,网络数据的存在形式越来越多,其中有很大一部分数据是以新闻组、讨论 组、BBS和邮件列表的形式存在。上述这种数据称为Session数据,虽然它们现在的组织结构及体现的价 值并不像网站那样直接,相信在不远的将来,我们很多重要的信息来源都离不开这些数据.为了降低对 Ses sion数据研究的复杂性,本研究以微软公司的PSS数据(一系列领域相关的邮件列表)为蓝本,分析了 s 用传统文本分类学习方法研究Sesion数据的困难和不足之处以及探索用于处理Session数据新的研究方 Sion 法的必要性。在上述前提下,本研究提出了两个层次的特征选择方法来改善性能

文档评论(0)

1亿VIP精品文档

相关文档