- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
北邮郭军web搜索chapter2概论
Web 搜索郭 军北京邮电大学 ;第2章 文本检索;引 言;Web信息采集;Crawler 的工作进程;Crawler的工作效率;Crawler的难题;文本的预处理与保存;文本的索引(1/2);文本的索引(2/2);检索模型;Boolean模型;VSM;相关性计算;索引词的权重;概率模型(1/2);概率模型(2/2);Bayesian推理网络模型;网页排序;PageRank;PageRank的完善;PageRank的近似解;HITS;查询重构;用户相关反馈;自动局部分析;局部语境分析LCA;基于概念空间的全局分析;基于同义词辞典的全局分析;文本聚类;区分式聚类的基本思想;区分式聚类的方式;Bottom-up方式例;Top-down方式例;层次汇合聚类HAC算法;k-means聚类;k-means聚类算法;k-means聚类示意;k-means聚类应用;软k-means聚类;基于亲和性消息的聚类;基于亲和性消息的聚类算法;生成式聚类;二值概率模型;多值概率模型;概率模型的参数估计;基于MLE准则的参数估计;EM算法(E步);EM算法(M步);EM算法(M步);文本分类; k-NN分类器;Bayes分类器;朴素Bayes模型;Bayes网络;最大熵原理;最大熵分类器;区分式分类器;SVM;SVM的优化目标;SVM的求解;非线性SVM;常用核函数;特征选择;包含算法;χ2 测度;互信息;Fisher鉴别;Fisher鉴别指数;排除算法;排除算法;特征维数确认;特征变换;SOM (Self-Organizing Map);SOM (Self-Organizing Map);LSI(Latent Semantic Index);LSI的意义;LSI的应用
文档评论(0)