- 1、本文档共12页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
SVDLSI模型导语SVD/01导语导语 由于向量空间模型的多种弊端,需要对其进行降维,将离散的数值向量转换到连续的向量空间中。当前一种比较有效的分析方法是LSI,有时也被称为隐性语义分析。 LSI一方面可以用更小的向量表示原文档向量,另一方面可以有效描述词汇间的相关性,降低一词多义和多词同义问题导致的文本分析误差。/02SVDSVD LSI模型是基于SVD的技术手段的,SVD技术可以将大多数矩阵转化为三个矩阵的乘积:SVD 其中,C是一个M*N的矩阵;U和V分别是M*M和N*N的方阵;是一个包含r个非零数值的对角矩阵。矩阵C的秩为r(rM,N),的维度属性与C是一致的,可以表示为:SVD U中的每列是 的特征向量,V中的每列是 的特征向量,若记为 和 的特征值,那么有关系:SVD 对矩阵C进行SVD的结果见下图。SVD 中对角线上的r个非零值对应原始矩阵中的有效信息,通过调节 中非零元素的个数,可以控制C的内容。 对角线上的非零元素越多,对应的C的信息量越丰富。人工指定 对角线上的某些非零数值为0,把分解后的矩阵再乘回去,C的结果就发生了变化。发生改变的C包含的有效信息减少了,但同时获得了更加简约的形式。更加简约的矩阵称作语义矩阵,获得隐式语义矩阵的过程称为LSI技术。 SVD
您可能关注的文档
- Struts2文件上传问题.pptx
- 二零二三年 优质公开课Struts2架构搭建.pptx
- 二零二三年 优质公开课Struts2配置文件.pptx
- STS列表出图的优点及识图方法.pptx
- STS钢框架的出图方式.pptx
- Studyexperience邮轮英语面试(学习经历).pptx
- style内联样式示例.pptx
- 二零二三年 优质公开课SubstationEquipmentInspection3.pptx
- 二零二三年 优质公开课substract算子.pptx
- Sunvalley利用亚马逊广告在旺季实现100%销售增长.pptx
- 山东省临沂市沂水县2023-2024学年高一下学期期中考试历史试题.docx
- 江苏省泰州市靖江高级中学2023-2024学年高二下学期4月期中考试物理试题(无答案).docx
- 新疆部分名校2023-2024学年高二下学期期中联合考试语文试题.docx
- 湖南省岳阳市岳阳县第一中学2023-2024学年高三下学期4月期中考试数学试题.docx
- 山东省烟台市2023-2024学年高二下学期4月期中生物试题(无答案).docx
- 江苏省靖江高级中学2023-2024学年高二下学期期中地理试题(无答案).docx
- 四川省甘孜藏族自治州某重点中学2023-2024学年高一下学期4月期中考试物理试题.docx
- 湖北省武汉市华中师范大学第一附属中学2023-2024学年高二下学期4月期中英语试题(无答案).docx
- 四川省成都市金牛区成都市实验外国语学校2024年高三三模考试生物试题.docx
- 浙江省宁波市北仑中学2023-2024学年高二下学期期中考试物理试题.docx
文档评论(0)