一种基于节点密度分割和标签传播的web页面挖掘方法 a method based on node density segmentation and label propagation for mining web page.pdfVIP

  • 5
  • 0
  • 约5.36万字
  • 约 16页
  • 2017-10-15 发布于上海
  • 举报

一种基于节点密度分割和标签传播的web页面挖掘方法 a method based on node density segmentation and label propagation for mining web page.pdf

一种基于节点密度分割和标签传播的web页面挖掘方法 a method based on node density segmentation and label propagation for mining web page

第38卷第2期 计 算 机 学 报 v01.38No.2 oF F曲。2015 2015年2月 CHINESEJOURNALCOMPUTERS 一种基于节点密度分割和标签传播的 Web页面挖掘方法 张乃洲” 曹 薇¨ 李石君2’ ’(河南财经政法大学计算机与信息工程学院 郑州450002) 2’(武汉大学计算机学院武汉430072) 摘 要获取Web页面中的重要内容如文本和链接,在许多Web挖掘研究领域有着重要的应用价值.目前针对该 问题主要采用Web页面分割和区块识别的方法.但现有的方法将Web页面中重要文本和链接的识别视为两个相 互独立的问题,这种做法忽略了web页面中文本和链接的内在语义关系,同时降低了页面处理的效率.文中提出 了一种web页面重要内容挖掘的统一框架,该框架主要

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档