- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于扩展特征向量空间模型的多源数据融合-山东大学学报理学版
第48卷 第11期 山 东 大 学 学 报 (理 学 版) 2013年11月
Vol.48 No.11 JournalofShandongUniversity(NaturalScience) Nov.2013
文章编号:16719352(2013)11008706 DOI:106040/j.issn.1671935222013099
基于扩展特征向量空间模型的
多源数据融合
陈珂锐,潘君
(河南财经政法大学计算机与信息工程学院,河南 郑州450002)
摘要:本体资源的扩充是自然语言处理的关键问题之一。传统的从单一数据源获取的信息其覆盖率较低,亟需建
立一个整体的数据管理平台,对数据资源分类存储与整理。为此提出了AVP数据平台,构建AVP平台所面临的
重要问题是多源数据的融合,即将不同来源的网站数据进行语义角色标注,对歧义词条进行识别判断,并最终归
并到以义项为基本单位的数据仓库中;为解决多源数据融合的语义角色标注问题,给出了一种自动语义判歧方
法。其基本思想是利用词条中的属性值对作为特征模板,并借助于属性值的共现概率,应用扩展向量空间模型对
词条进行歧义识别。通过大量的实验对比可知,该系统在各方面均取得优异的成绩,所提出的算法能够很好地解
决多源数据融合中的语义判歧问题。
关键词:自然语言处理;本体;多源数据融合;语义判歧
中图分类号:TP391 文献标志码:A
Multisourcedatafusionbasedontheexpandvectorspacemodel
CHENKerui,PANJun
(CollegeofComputerandInformationEngineering,HennanUniversityofEconomicsandLaw,
Zhengzhou450002,Henan,China)
Abstract:Theexpansionofontologyresourceisoneofthekeyforthewholenaturallanguageprocessing.Sincethein
formationobtainedtraditionallyfrom singledatasourcecouldnotreflecttheoverallpictureandthecoveragerate
doesn’treachtargetedone,theconstructionofanintegrateddatamanagementplatformwouldberequiredtostoreand
organizedatasourcesbyclassification.TheAVPdataplatformwasproposedfirstly.Intheprocessofdataconstruction
onAVPplatform,themostimportantissueistointegratemultisourcedata,inotherwords,toperformsemanticrole
labelingonwebdatacomingfromdifferentsources,toidentifyambiguousentries,andtoeventuallymergeintodata
warehouseswhichusesenseasthebasicunit.Anautomatedmethodofsemanticrolematchinghasbeensuggested,and
itwouldsolvethe
您可能关注的文档
- 国外医学术语标准化发展对我的启示-科技支撑计划.PDF
- 国外数据库系统Web20个性化服务研究.PDF
- 国外术语注册与术语服务综述术.PDF
- 国家公派留学管理信息平台使用指引-武汉纺织大学国际交流与合作处.DOC
- 国家企业信用信息公示系统部门协同监管平台-山西工商局.PDF
- 国家公派留学管理信息平台使用指引-北京中医药大学研究生院.DOC
- 国会图书馆资料库教育训练OnefileBRCOVRDDDRS.PPT
- 国家基层策略行为与社区过程-中国社会学网.PDF
- 国家公派留学管理信息平台使用指引非学生类.DOC
- 国家海洋局2017年事业单位公开招聘考试大纲-国家海洋人才网.DOC
- 基于改进和声搜索算法的配电网重构-电网与清洁能源.PDF
- 基于改进TWR-TDOA定位算法的超宽带定位系统UWB-计算机应用.PDF
- 基于改进的TF-IDF算法及共现词的主题词抽取算法-南京大学学报.PDF
- 基于改进线图分析算法的浅层汉语句法分析器的设计-计算机应用研究.PDF
- 基于数据包络分析的电能质量评价-电测与仪表.DOC
- 基于文件的数据结构-Mapfile.PPT
- 基于文本挖掘分析甲型H1N1流感的中医药治疗特色元-世界科学技术.PDF
- 基于文本挖掘的投诉热点智能分类-上海师范大学学报.PDF
- 基于文本挖掘的漏洞信息聚类分析-东南大学学报.PDF
- 基于文献计量的国内语义角色标注研究现状分析-情报杂志.PDF
最近下载
- 湖南省自然科学基金学科分类目录及代码.pdf VIP
- 人教版三年级上册道德与法治教学计划.docx VIP
- 检验检测机构资质认定评审准则培训考试卷(附答案).docx VIP
- 事业单位内部控制操作手册.pdf VIP
- DB32T 4611-2023 建设用地地下水污染修复和风险管控技术导则.pdf VIP
- 8.煮面条(课件) 教学课件.ppt VIP
- 《新媒体技术:基础 案例 应用》课件 项目5 使用自媒体工具.pptx VIP
- 2025年济南市中考语文试题卷(含答案解析).docx
- 第2课 第二次鸦片战争 课件(26张PPT).pptx VIP
- 项贤明主编马工程教材《教育学原理》第九章教师与学生.ppt VIP
文档评论(0)