- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
以本体构造中文信息过滤中的需求模型
1 1 1 2
袁兴宇 ,王挺 ,周会平 ,肖君
1 2
国防科技大学计算机学院, 上海远程教育集团
摘要:在信息过滤系统中,用户模板是机器可理解的用户需求表示形式,是否能准
确地反映出用户的真实需求将直接影响着过滤系统的性能。在向量空间模型中,用
户的模板表现为一组带权重的特征词集,但由于在这样的用户模板中缺少必要的语
义信息,很难准确地反映出用户的需求。本文提出了以本体构造需求模板的方法,
以本体的形式定义需求中概念间的语义关联关系,将向量空间模型中的特征向量定
义为本体中的实例,通过实例间的关联路径计算特征项间的语义关联,并通过特征
项间的语义关联计算出文档与模板的语义关联度。
关键词:信息过滤;本体;语义关联;用户模板
1. 引言
信息过滤就是从动态的信息数据流中查询满足用户特定需求信息的过程。 这种用户的特
定需求在信息过滤系统中表示为一个用户模板,对流入的信息流, 根据用户定义的模板来判
断某信息是否满足于用户的需求。因此,用户模板是否能真实而准确的反映出用户的需求将
直接影响着过滤系统的性能, 成为影响过滤性能的主要瓶颈之一。 在信息检索与信息过滤中,
为了使机器能更为准确地理解用户提交的查询需求和待处理的信息内容,本体、语义理解、
知识推理等技术的应用变得越来越广泛。现今,在对信息的处理及理解上,应用的最多的两
个通用型本体就是英文的 WordNet 和中文的“知网” (HowNet)。在对内容的处理上,[1]
利用 “知网”建立了真实文本的概念关系图,并在此基础上对文本的内容进行了基于理解的
推理;[2]则是利用 WordNet 将文档表示为一个带有分值的概念节点集合来表示文档中的语
义内容。在对用户的需求表述上,[3]、[4]提出了以语义框架构造用户需求模型的方法,利
用已有的概念层次词典将用户的需求以一种语义框架的结构来表述, 这种语义框架其实就可
认为是一种本体结构模型。
本文以 owl 作为本体的描述语言来构造用户的需求模型, 利用本体中各个节点间关联体
现出在需求中各概念间的语义关系, 并根据节点间关联路径, 反映出概念间语义关联的强弱。
本文所构造的本体属于任务本体,是针对某一具体需求而构建的本体,根据用户需求中的内
容和语义倾向,将本体划分为不同区域来反映需求中的语义倾向和具体的需求。
本文下面的内容主要包括:第二节介绍本过滤系统的体系结构;第三节介绍本体模板的
构造与描述;第四节为语义关联强度计算;第五节为实验设计及结果分析;第六节给出了结
论以及今后的进一步工作。
2. 系统体系结构
图 1 为本过滤系统的体系结构图:
待过滤文本 正例文本 用户 的需
求描述
文本特征向量 实例向量 本体模板
语义关联强
度〉阈值 相关文档
图 1 过滤系统结构
Fig.1Architecture of filtering system
本系统主要的核心部分是本体模板的构造和语义关联强度的计算。在本体模板的构造
上,从用户给出的需求描述和提供的正例文本出发,将需求中的特征项定义为本体中实例,
将特征项间的语义关系定义为本体中的属性关联。 在语义关联强度的计算上,将特征项与本
体中相应的实例相关联, 组成与特征向量相对应的实例向量。 根据本体中实例间的关联关系,
以实例间的关联路径作为它们间的关联强度, 计算实例向量中各实例的语义关联强度。 最后,
计
您可能关注的文档
- 学做智能车_挑战飞思卡尔之智能车制作.ppt
- 循环荷载下非饱和结构性黄土损伤模型.pdf
- 循环荷载作用下高强混凝土收缩徐变试验的研究_唐云清.pdf
- 压电变压器原理、的研究及应用.pdf
- 压电陶瓷圆片振子耦合振动等效电路.pdf
- 压力容器设计基本思路.ppt
- 压敏电阻电特性测试的研究.pdf
- 压敏电阻型号及电感计算公式.doc
- 压敏电阻在电路过压和ESD防护中应用.pdf
- 压缩感知在高速(雷达)信号采集中应用.doc
- 2024-2025学年公务员(国考)模拟题库附完整答案详解(名师系列).docx
- 2023年雅安市公务员行测(考点提分)附答案详解.docx
- 永春第一中学高二下学期5月月考语文试题(图片版,含答案).docx
- 【期末考点突破】专题04文言文阅读16篇(专项训练)统编版语文四年级下册(含答案).docx
- 统编版语文二年级下册期末核心素养检测卷-(含答案).docx
- 第二十八中学中考一模语文试卷(含答案).docx
- 2025年新高考Ⅰ卷语文押题预测卷02(含答案).docx
- 统编版(2024)语文七年级下册第1课《邓稼先》练习(含答案).docx
- 卷)2025年九年级中考考前最后一卷语文试卷(含答案).docx
- 实验中学2025届高三下学期全真模拟考试语文试卷(含答案).docx
最近下载
- 人教版初中生物会考试卷及答案.pdf VIP
- 2023年海南师范大学软件工程专业《数据结构与算法》科目期末试卷B(有答案).docx VIP
- 2023年四川省广元市中考地理试题卷(含答案详解).docx
- 2023年海南师范大学软件工程专业《数据结构与算法》科目期末试卷A(有答案).docx VIP
- 广西师范大学2020-2021学年《认知心理学》期末考试试卷(B卷)含参考答案.docx
- 羊常见疾病防治.ppt VIP
- 国开期末考试3987《Web开发基础》机考试题及答案(李老师第5套).pdf VIP
- 2024年怀化市靖州苗族侗族自治县六年级下学期小升初真题精选语文试卷含答案.doc VIP
- 2023年海南师范大学软件工程专业《计算机网络》科目期末试卷B(有答案).docx VIP
- 2025年社区工作者招聘考试题库及答案解析.docx VIP
文档评论(0)