以本体构造中文信息过滤中需求模型.pdfVIP

以本体构造中文信息过滤中需求模型.pdf

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
以本体构造中文信息过滤中的需求模型 1  1  1  2  袁兴宇  ,王挺  ,周会平  ,肖君  1  2  国防科技大学计算机学院,  上海远程教育集团 摘要:在信息过滤系统中,用户模板是机器可理解的用户需求表示形式,是否能准 确地反映出用户的真实需求将直接影响着过滤系统的性能。在向量空间模型中,用 户的模板表现为一组带权重的特征词集,但由于在这样的用户模板中缺少必要的语 义信息,很难准确地反映出用户的需求。本文提出了以本体构造需求模板的方法, 以本体的形式定义需求中概念间的语义关联关系,将向量空间模型中的特征向量定 义为本体中的实例,通过实例间的关联路径计算特征项间的语义关联,并通过特征 项间的语义关联计算出文档与模板的语义关联度。 关键词:信息过滤;本体;语义关联;用户模板  1. 引言 信息过滤就是从动态的信息数据流中查询满足用户特定需求信息的过程。 这种用户的特 定需求在信息过滤系统中表示为一个用户模板,对流入的信息流, 根据用户定义的模板来判 断某信息是否满足于用户的需求。因此,用户模板是否能真实而准确的反映出用户的需求将 直接影响着过滤系统的性能, 成为影响过滤性能的主要瓶颈之一。 在信息检索与信息过滤中, 为了使机器能更为准确地理解用户提交的查询需求和待处理的信息内容,本体、语义理解、 知识推理等技术的应用变得越来越广泛。现今,在对信息的处理及理解上,应用的最多的两 个通用型本体就是英文的  WordNet  和中文的“知网” (HowNet)。在对内容的处理上,[1]  利用 “知网”建立了真实文本的概念关系图,并在此基础上对文本的内容进行了基于理解的 推理;[2]则是利用 WordNet 将文档表示为一个带有分值的概念节点集合来表示文档中的语 义内容。在对用户的需求表述上,[3]、[4]提出了以语义框架构造用户需求模型的方法,利 用已有的概念层次词典将用户的需求以一种语义框架的结构来表述, 这种语义框架其实就可 认为是一种本体结构模型。 本文以 owl 作为本体的描述语言来构造用户的需求模型, 利用本体中各个节点间关联体 现出在需求中各概念间的语义关系, 并根据节点间关联路径, 反映出概念间语义关联的强弱。 本文所构造的本体属于任务本体,是针对某一具体需求而构建的本体,根据用户需求中的内 容和语义倾向,将本体划分为不同区域来反映需求中的语义倾向和具体的需求。 本文下面的内容主要包括:第二节介绍本过滤系统的体系结构;第三节介绍本体模板的 构造与描述;第四节为语义关联强度计算;第五节为实验设计及结果分析;第六节给出了结 论以及今后的进一步工作。  2. 系统体系结构 图 1 为本过滤系统的体系结构图: 待过滤文本 正例文本 用户 的需 求描述 文本特征向量 实例向量 本体模板 语义关联强 度〉阈值 相关文档 图 1  过滤系统结构  Fig.1Architecture of filtering system  本系统主要的核心部分是本体模板的构造和语义关联强度的计算。在本体模板的构造 上,从用户给出的需求描述和提供的正例文本出发,将需求中的特征项定义为本体中实例, 将特征项间的语义关系定义为本体中的属性关联。 在语义关联强度的计算上,将特征项与本 体中相应的实例相关联, 组成与特征向量相对应的实例向量。 根据本体中实例间的关联关系, 以实例间的关联路径作为它们间的关联强度, 计算实例向量中各实例的语义关联强度。 最后, 计

文档评论(0)

nnh91 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档