- 42
- 0
- 约2.65千字
- 约 41页
- 2018-08-31 发布于江苏
- 举报
潜在语义标引及其应用
潜在语义标引及其应用 Wang Jimin Nov 11, 2005 Outline 矩阵的奇异值分解 (SVD) LSI 与SVD LSI的应用 Introduction 在文档集合中假设词语之间具有独立性(正交假设),一篇文档可用向量空间模型(VSM)中的一个向量来表示,进而计算查询与文档间的相似性,进行信息检索 但自然语言中词语的同义性和多义性是普遍存在的,如“计算机与电脑”、“virus”、“bank”。 词与词之间是有关联关系的 Introduction 如何修正“正交假设”的缺陷与不合理性,并将文本检索从离散的索引词匹配深入到概念或语义匹配的层面上,就成为代数检索迫切需要解决的问题 M. W. Berry 和S. T. Dumais 在20世纪80年代末提出了一种新的信息检索模型:潜在语义标引(Latent Semantic Indexing,LSI),它可以看作经典向量空间模型(VSM)的一种改进 Introduction LSI是一种建立在统计之上的学习方法:它试图发现对象之间的关联模式及其隐藏的对象间的结构关系。 LSI方法最初应用于文本信息检索领域,它可以有效地解决了同义词和多义词的问题,通过识别文本中的同义词, LSI将信息检索精度提高了10%--30%. 随着应用领域的不断拓展, LSI已在信息过滤、信息分类/聚类、交叉语言检索、信息理解、判
您可能关注的文档
- 满足消费者价值需求地创新品牌定位法.doc
- 滚轮注射模具计毕业论文设计.doc
- 滤布使用|滤编辑和滤布过滤性能介绍.ppt
- 滦南柏各庄镇农村专业技术协会等单位申请对柏各庄大米.doc
- 滨州企业技术中心认定申请材料.doc
- 滨州公共资源综合性专家库专业分类标准(试行).doc
- 滨州大学一流学科建设计划.doc
- 滨州大学化学工程系.doc
- 滨州市交通运输规划基建科2016年4月.doc
- 滨州市交通运输规划基建科2016年6月.doc
- 统编版二年级语文上册课件《语文园地八》.pptx
- 眼部肌肤护理的日常习惯.pptx
- 第十单元 常见的酸、碱、盐 复习课(酸碱盐的化学性质)课件(内嵌视频)2025-2026学年九年级化学人教版下册.pptx
- 眼部肌肤护理的科学方法.pptx
- 2.4 磁铁能吸什么 课件(内嵌视频)2026-2027学年科学二年级上册苏教版.pptx
- 统编版二年级语文上册课件《阅读18 古诗二首》.pptx
- 科学二下4.12 寻访小动物的家 课件(苏教版2026新教材).pptx
- 煤矿企业各岗位安全生产风险告知.docx
- 第18课《井冈翠竹》课件-统编版语文七年级下册.pptx
- 第二章气体 液体和固体_气体液体固体单元复习课- 课件 -2026-2027学年高二下学期物理粤教版(2019)选择性必修第三册.pptx
原创力文档

文档评论(0)