基于语义网的初中数学的自动语义标注方法分析与实现-analysis and implementation of automatic semantic annotation method for junior high school mathematics based on semantic web.docxVIP

基于语义网的初中数学的自动语义标注方法分析与实现-analysis and implementation of automatic semantic annotation method for junior high school mathematics based on semantic web.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于语义网的初中数学的自动语义标注方法分析与实现-analysis and implementation of automatic semantic annotation method for junior high school mathematics based on semantic web

独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。作者签名:日期:年月日论文使用授权本学位论文作者完全了解电子科技大学有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后应遵守此规定)作者签名:导师签名:日期:年月日摘要互联网作为人们日常生活中不可或缺的资源,它的发展速度快得超乎人们的想象。呈指数级增长的网页同时意味着不断膨胀的海量数据,而蕴含其中有价值的信息却不容易被机器发现,人们在使用和管理互联网的过程中显得有些力不从心。为了使这些文档能够被计算机挖掘出语义信息,为web应用提供更为准确的服务,这些现实需求和语义网不谋而合。语义标注是语义网发展的重要技术支撑,该技术为现存互联网中海量文档贴上语义标签。凭借特定的领域本体为网页文档增加语义信息,即发布网页文档的语义信息就是语义标注。本文主要研究语义标注,主要内容内容如下:首先,本文是为中文网页的初中数学领域文档做标注,介绍了语义标注所需的技术的发展现状,包括语义网技术、中文分词技术以及语义标注等相关理论及技术等。其次,提出了一种基于本体距离的分类方法,通过计算文档的语义聚合度来选标注文档。将网页转化为结构化文档之后,通过中文分词,将结构化文档转化为词汇文档,利用初中数学知识本体网络图计算词汇文档中专有词汇之间(此处和后面提及的专有词汇均指初中数学专业词汇)的本体距离,当词汇之间的本体距离在某个阈值之内时将这两个词汇视为同一类,将这些专有词汇归类之后,计算前k类词汇集合占整个词汇文档的比重,即语义聚合度,聚合度较高的认为是初中数学主题相关的网页,如果聚合度低则丢弃文档。再次,提出了一种基于本体前驱累计统计算法,抽取文档的深层语义,将提取出来的语义信息作为标注添加到结构化文档中。在筛选出待标注文档之后,对词汇文档中的专有词汇做前驱累计统计,计算出文档中所有专有词汇的词频,通过特定算法选出专有词汇作为语义标注信息,以节点的形式添加到原结构化文档中,最终实现了文档的自动语义标注。最后,实现了一个用于标注初中数学的中文网页的自动语义标注系统,在上述算法的基础之上实现了该系统的核心模块--自动语义标注模块和系统其他功能模块,并对比了标注前后带来的效果和优势。关键字:语义网,基于本体距离分类,语义聚合度,本体前驱统计,语义标注ABSTRACTAsanintegralpartofpeoplesdailylife,thedevelopmentspeedofinternetisbe-yondpeoplesimagination.TheexponentialgrowthofWeb,alsocalledever-expandingdatawhichcontainsvaluableinformation,isnoteasytofind.Andwecannotuseitormanageitproperly.Inordertomakethesedocumentsdigoutthesemanticinformationbycomputers,andtoprovidemoreaccurateservicesforwebapplications,thesepracticalneedsagreewiththesemanticWebwithoutpreviousconsultation.AsanimportanttechnologyofthedevelopmentofsemanticWeb,semanticannotationaffixsemantictagstothemassivedocumentsofWeb.Withspecificdomainontology,semanticinformationwasaddedtoWebdocuments.Inotherwords,thesemanticinformationpublishedbyWebdocumentsisthesemanticannotation.ThisthesismainlymarksforthedocumentsofthejuniorhighschoolmathematicsfieldwhichbelongstoChineseWeb.Firstly,itintroducesthe

您可能关注的文档

文档评论(0)

xyz118 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档