基本概念-山东大学信息检索室.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * BM25 排序公式 隐性语义索引模型 Latent Semantic Indexing 一般文档的特征表示维数都很高,对文本常是上万维,对图像也常是50-60多维,带来的问题是: 1)向量中0很多,即稀疏性 2)存储空间要求很大 3)虽然说维数也多,似乎对文档的特征描述越全面,但由于数据的稀疏性,有时维数大,计算的效果不一定比维数小的好 能否去掉一些线性相关的向量来减少维数 线性代数中的矩阵特征向量! 如何精选标记词? 特征值 特征向量 Eigenvectors (for a square m?m matrix S) How many eigenvalues are there at most? only has a non-zero solution if this is a m-th order equation in λ which can have at most m distinct solutions (roots of the characteristic polynomial) – can be complex even though S is real. eigenvalue (right) eigenvector Example 矩阵-向量乘积 具有特征值 3, 2, 0,对应的向量有 任何向量 ( x= ) 可以看出是特征向量的组合 x = 2v1 + 4v2 + 6v3 这样矩阵-向量乘积可以用特征值和特证向量表示出来 虽然向量 x 是任意的,但Sx 则是也是由特征值和特征向量的组合所决定的。 线性代数知识 一个n × n的实对称矩阵 M 是正定的当且仅当对于所有的非零实系数向量z,都有 zTMz 0。其中zT 表示z的转置。 M是半正定矩阵当且仅当对所有不为零的x?Rn (Cn),都有: x*Mz ? 0, x* 为x的共轭转置。 Example Let Then The eigenvalues are 1 and 3 (nonnegative, real). The eigenvectors are orthogonal (and real): Real, symmetric. Plug in these values and solve for eigenvectors. 特征值 特征向量 对对称矩阵, 对应不同特征值的特征向量之间是正交的 ( orthogonal) 所有实对称矩阵的特征值是实数. 对正的半正定矩阵的所有特征值是非负的。 矩阵的奇异值分解 m?r r?r V is r?n 对任意m? n 矩阵 A ,A 的秩为 r,均可分解为两个正交矩阵和一个对角矩阵的乘积(Singular Value Decomposition SVD) U 的列向量是由 AAT (正定矩阵)的相互正交的特征向量组成. Singular values. Eigenvalues ?1 … ?r of AAT are the eigenvalues of ATA. V 的列向量是由 ATA (正定矩阵)相互正交的特征向量组成. 满足 SVD can be used to compute optimal low-rank approximations. Approximation problem: Find Ak of rank k such that A and X are both m?n matrices. Typically, want k r. Low-rank Approximation Frobenius norm Solution via SVD Low-rank Approximation set smallest r-k singular values to zero column notation: sum of rank 1 matrices k SVD example Let Thus m=3, n=2. Its SVD is Typically, the singular values arranged in decreasing order. LSI 与 SVD LSI 是在 SVD 的基础上,只保留最大的k 个奇异值, 而忽略较小的奇异值,从而达到进一步降维,即前面讲的近似方法。 具体做法是: SVD 得到的?,只保留最大的k 个奇异值得到?’, 进行奇异分解的反运算, 得到 A 的近似矩阵 索引词 文档 将A 进行 SVD 分解的 A = U?VT 其中, 计算机

文档评论(0)

sunhongz + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档