- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
信 息 科 学 与 技 术 学 院
毕 业 设 计 开 题 报 告
音乐领域语义搜索引擎设计与实现
学 号:
姓 名: 刘妍
班 级: 通信三班
专 业: 通信工程
指导老师: 贾真
职 称: 讲师
2014年3 月 17 日
开题报告的内容应包括
本的目的、意义
开 题 报 告 主 要 内 容
本课题的目的、意义
然而,当前绝大部分搜索系统都是基于关键字的检索系统。虽然某些网站,如百度,Google等,通过一定的技术,使得其检索具有了一定的语义特征。但是从用户体验的角度来讲,在某些检索需求上还远远不能够达到理解用户想所需的要求因此,基于语义的捜索引擎的研究具有重要的现实意义,提高搜索引擎对用户的语义理解和支持是未来搜索技术的发展方向。
2、本课题国内外研究现状(国内外文献综述,给出参考文献)
2..1浅层语义
由Deerwester等人提出的浅层语义索引[1] (Latent sernantic indexing),其利用统计学上相关词的统一性来使检索获得一定的语义性。他假设在大量文档的随机词汇下隐藏着语义结构,然后利用奇异值分解[2](singular value decomposition:SVD)的统计学方法来估算这种语义结构,获得基于SVD方法的隐藏语义结构的词汇表达和文档。这种结构也叫隐藏概念空间,其关联词义相近的词汇和文档。在检索和索引的过程中利用隐藏概念空间的变形词汇取代原先的词汇,从而使检索获得语义性。
2.2语义网
虽然当前Web存在着海量的信息,但是当前Web存在着一系列的缺陷。首先,Web内容使提供给人来理解和浏览的,由于Web内容没有采用形式化表示,缺乏明确的语义表示,使得计算机理解的仅为Web内容的二进制表示。从而导致计算机不能够理解Web内容的含义。其次,网页中链接使通过URL来实现,由于URL也不具备语义特征。使得网页之间只是内容的堆积,而没有语义层面的关系,从而导致信息检索过程中不能够挖掘关眹的信息。最后,由于当前各种智能信息终端,如:平板电脑,智能手机等飞速发展,使得其也有必要获取web上的信息进行智能交互,当前的互联网也不具备这样的功能。
考虑到以上问题,为了使计算机能够理解和处理网页内容,迅速准确地从海量网页中査找所需要的内容,1998年Berners-Lee提出了语义网(Sernantic Web)[3],意图让信息以计算机可理解和可处理的方式建立起来,并且在网络条件下普及,从而实现网络环境下的检索和推理。然而,由于语义网尚面临着诸多问题,导致其迟迟得不到大规模应用, 数据问题,衧能问题,安全问题是浯义网面临的主要问题。
数据问题
数据问题是当前语义网最核心的问题。考虑到网络数据的多样性,多领域性。语义
网络的数据标记方式必须是灵活的,可扩展的。目前,W3C(world wide web consortium)定义了一些语义网数据规范,如:RDF(resource description framework)[4],RDFS(RDF scbema)[5]/OWL(web oritology language)[6]等。但是当前上的绝大部分内容都没有符合语义网规范的标记,为当前web添加语义标注除了数据的多样性带来的标注方式难以统一的问题,同时也面临着巨大的成本问题。
(2)智能问题
语义网面临的另外一个重要的技术难题是如何能够是计算机推理。由于现实世界中具有诸多的不确定性和动态性,内容表述具有的模糊性,使得对推理规则逻辑的设定具有相当的技术难度,同时,自然语言理解技术的相对不成熟也是计算机获得推理 能力的一个障碍。
(3)安全问題
在通过语义网络链接各种异构的信息源,实现信息互通的同时,也是如个人私密信息,涉密机构及计划的信息可能泄漏的问题,这可能导致严重的后果。注意到这一点, 研究人员正在发展一些技术或机制来增强语义网的安全性。
2.3基于本体的信息检索
本体[7]作为一种能够在语义和知识层次上描述信息系统的概念模型工具,自提出来以来就引起了国内外研究人员的关注,并且在信息检索与获取、软件工程、自然语言处理等方面有很重要的应用[8][9][10]。基于本体的语义检索主要强调利用本体自身的特征实现査询扩展和文档的语义处理。
早在1994年,Voorhees就提出基于本体的査询扩展[11][12],使用本体中的概念进行查洵扩展,并得出利用本体中的同义词和相关概念的子类关系进行扩展。Maki在2003 年提出了基于本体结构的查询扩展方法,将概念用联通的路径表示,通过路径的长短、方式来获取概念的相似度。Navigli于2004年提出了基于本体注释的查询扩展
您可能关注的文档
最近下载
- 护理事业十五五发展规划(2026-2030).docx VIP
- 规范《GB1631-79-离子交换树脂分类、命名及型号》.pdf VIP
- smt转正工作总结报告.pptx
- Unit+1+Laugh+out+loud+Understanding+ideas+高中英语外研版(2019)选择性必修第一册.pptx VIP
- 《小交通量农村公路工程技术标准》(JTG 2111-2019).pdf VIP
- 物理竞赛全套课件.pdf
- 2025年临床中成药应用精选题库与解析.docx
- 人机交互设计 课件 第3章 交互设备.pptx
- 2025届高三数学高考二轮专题复习:立体几何解答题专练(含解析).docx VIP
- (初中信息技术学业水平考试知识点1.doc VIP
原创力文档


文档评论(0)