基于语义分析的网络爬虫模型的研究.pdfVIP

下载本文档

12
0
约2.54万字
约 2页
2017-09-13 发布于河南
举报
版权申诉

基于语义分析的网络爬虫模型的研究.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

科技信息 ○本刊重稿○ SCIENCE TECHNOLOGY INFORMATION 年第期 2008 35 基于语义分析的网络爬虫模型的研究刘炜张红云熊前兴（武汉理工大学计算机科学与技术系湖北武汉 430063 ）摘要针对传统通用网络信息采集系统自身固有的缺陷根据语义分析的相关理论本文提出了基于语义的网络爬虫的相关模型该模【】，，，型构建知识概念集合并对其进行关键字切割与划分生成能表达主题的主题关键词集合结合中国知网的相关理论与技术对传统抓取的，，。《》，网页在语义的角度进行分析对已抓取的网页页面内容及其中链接的扩展元数据等相关信息进行分词及语法语义等相关处理获取网页内容，，关键词集合及超链接的关键词集合然后分别对获取的网页内容关键词与链接关键词进行与主体关键词集合采用语义分析算法进行语义相关，性的判定保存需要的网页并预测及提取与主题相关的从而提高网络资源信息采集相关率，， URL ，。关键词领域知识集网络爬虫扩展元数据知网【】；；； Research Of Web Crawler Based On Semantic Analysis LiuWei,ZhangHong-yun, XiongQian-Xing (Department Of Computer Science And Technology,WuHan University Of Technology , WuHan HuBei 430063, China) 【Abstract 】According to inborn defects of the traditional general web crawler,besides relevant theories of semantic design,we put forward a new model of web crawler which is based on semantic technology. The model make full use of the technology to generate a collection of domain knowledge topics which will be processed in key words and divided into several segments.The model will finally produced a collection containing whole key words related with topics.Also,It w