- 1、本文档共60页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE
PAGE 1
基于人工神经网络的网页间关系的识别
摘 要
语义 WEBSemantic Web向我们展示了下一代 WEB 的可能的架 构 在这个架构中 机器将可以理解 WEB 中的信息 我们的研究工作 的目标是在拥有领域 Ontology 的情况下 在普通的 HTML 格式的网页 中嵌入机器可以理解的信息 我们当前研究工作的重点是从现有的普通 网页中抽取领域 Ontology 中定义的概念和关系的实例 本文提出了一 种新的 用于识别网页间关系 一种关系实例的方法 其基本思想是
综合考虑网页内容和网页间的超链接Hyperlink关系 利用人工神经 网络Artificial Neural Network ANN通过训练 发现隐含的识别模 型 进而实现网页间关系的识别
在我们的方法中 我们比较全面的考虑了对于判断网页间的关系有
较大影响的因素 包括 网页的类别 网页间超链接的数目和种类 网 页间基于内容的相关度 对这些因素分析的结果将构成人工神经网络的 输入向量 通过训练 我们得到了稳定的识别模型 我们的测试表明
识别模型能够比较高效的识别网页间的关系
为了获得上述因素的信息 我们借用了一些成熟的技术 如文本分
类技术用于网页分类网络爬虫技术用于网页收集和链接分析
等 并针对具体应用提出了相应的修改 完善了相关的原型算法 实现
了相关的工具
基于上述思想和工具 我们实现了一个原型系统 ARROW 系统
ARROW 系统是一个综合平台 整合了训练 测试和网页关系识别 3 个
功能 它提供了一个友好的界面供用户训练识别系统 在这个系统中
用户可以测试识别模型 测试结果将以直观的方式显示给用户 在实际
应用中 ARROW 系统可以作为后台程序 用于网页关系的识别 在本 文中 对于 ARROW 系统的设计 实现和工作过程做了一个简明的介 绍 同时 给出了我们获得的一些初步的实验数据
关键字
关系 网页 人工神经网络 语义 WEB
RECOGNIZING THE RELATIONS BETWEEN WEB PAGES USING ARTIFICIAL NEURAL NETWORK
ABSTRACT
Semantic Web shows us a potential infrastructure of the next generation Web. Web information will be understandable to machines in this infrastructure. Our research work has the aim of embedding machine- understandable semantic information in ordinary HTML files automatically given the domain ontology. We focus on automatically acquiring the instances of concepts and relations defined in domain ontology from Web pages. This paper describes how to recognize the relation between Web pages (a kind of relation instance) by using Artificial Neural Network (ANN).
In our method, we comprehensively consider the factors that will affect making the decisions, including the type of Web pages, the number and type of hyperlinks between the Web pages, and the similarity in Web pages’ contents. These factors will be used to construct the input vector of ANN. We can get the stable recognition model by training. And the experiment data show that the recognition model works well on the Web pages from the real
world.
In order to acquire the data of above-me
您可能关注的文档
- 基于网购的第三方物流服务商客户满意度实证研究-物流工程专业论文.docx
- 基于稀有特征保持的高光谱遥感图像维数分析-通信与信息系统专业论文.docx
- 基于通用框架的项目流程管理系统设计与实现-计算机技术专业论文.docx
- 基于物联网的楼宇电磁检测系统设计-市政工程专业论文.docx
- 基于数据挖掘的Web权威页面搜索-计算机软件与理论专业论文.docx
- 基于商业智能技术的移动通信CRM系统研究-软件工程专业论文.docx
- 基于全厚式车辙试验的沥青路面车辙预估-道路与铁道工程专业论文.docx
- 基于前方图像的道路日常巡查快速检测技术-信号与信息处理专业论文.docx
- 基于视觉心理学理论的空气调节系统与家居卧室环境的和逸性分析-设计艺术学专业论文.docx
- 基于碳纳米管表面分子印迹固相萃取材料研究-分析化学专业论文.docx
- [专精特新]金华永和氟化工有限公司行业竞争力评级分析报告(2023版).pdf
- [专精特新]重庆升光电力印务有限公司行业竞争力评级分析报告(2023版).pdf
- [专精特新]无锡巨力重工股份有限公司行业竞争力评级分析报告(2023版).pdf
- [专精特新]江西凯安新材料集团股份有限公司行业竞争力评级分析报告(2023版).pdf
- [专精特新]浙江永昌电气股份有限公司行业竞争力评级分析报告(2023版).pdf
- [专精特新]苏州中创铝业有限公司行业竞争力评级分析报告(2023版).pdf
- [专精特新]杭州汽轮铸锻有限公司行业竞争力评级分析报告(2023版).pdf
- [专精特新]浙江美声智能系统有限公司行业竞争力评级分析报告(2023版).pdf
- [专精特新]汕头市虹桥包装实业有限公司行业竞争力评级分析报告(2023版).pdf
- [专精特新]江西亚中电子科技股份有限公司行业竞争力评级分析报告(2023版).pdf
文档评论(0)