垂直搜索引擎技术分析与应用——承乘广缘网站搜索引擎的设计-analysis and application of vertical search engine technology - design of chengcheng guangyuan website search engine.docxVIP
- 1
- 0
- 约4.59万字
- 约 57页
- 2018-07-05 发布于上海
- 举报
垂直搜索引擎技术分析与应用——承乘广缘网站搜索引擎的设计-analysis and application of vertical search engine technology - design of chengcheng guangyuan website search engine
西安建筑科技大学硕 西安建筑科技大学硕 士学位论文support vectοr machine web text cIassification.ηle classifier algorithm analyzed the advantage of support vector machine in text classification,and combined the merits of support vector machine dichotomy theory,made a specification among many successively using the multicIass classification.ηlere are many merits of this new cIassification,inc沁huldin吨gs刽im抖plemod由创e巳l,accura纪te cJaω孤ss剑s剑蚓i珩趴m加lIηn巳einformation indexing model based 0∞n t也he Cαhines巳 character of re飞:V巳创r饲sa划lindexing database is proposed. Using the way of positive-sequence index results to establish indexing database,and utilizing improved links-form memorizing structure in this paper,all to cut the costs of refreshing database for server.The last ,according ωwhat are analyzed above,出is paper provides systematicgeneral frame design ofVertical Search engine for Business Search website.Key words : Vertical Search ,Shark-Search algorithm ,Suppo此 Vector Machine ,Jnverted OrderThesis: Application Fundamentm乒目录第一章绪论11.1 本文选题背景 11.2 搜索引擎 21.2.1 搜索引擎的发展简史... 21.2. 2 搜索引擎分类.. 41.2. 3 通用搜索引擎的组成及工作原理 ;)1.2. 4 搜索引擎的发展趋势... 71.3 垂直搜索引擎 81.3. 1 通用搜索引擎的不足. . 91.3. 2 垂直搜索引擎的优势.. 91.3.3 垂直搜索引擎与通用搜索引擎的差别. 1.3. 4 研究现状 101.4 本文的研究内容和论文结构. 11第二章 背景知识和相关技术研究现状 122. 1 页面解析和中文分词技术. 122. 1.1 Url 和 Http. 122. 1.2 页面解析技术 132. 1.3 中文分词简介 142.2 网络蜘蛛 SPIDER 工作原理. 15Spider 的概念 152 Spider 的技术要求. 15Spider 的工作原理. 152. 3 向量空间模型 172.4 支持向量机 182. 5 超链分析算法. 18PageRank 算法. 18HITS 算法. 19PageRank 算法与 HITS 算法比较. 202.6 本章小结 21 HYPERLINK \l _TOC_250000 第三章搜商网垂直搜索引擎的 SPIDER 设计 22J3. 1 SPIDE:R 搜索策略分析. 223. 1.1 通用搜索引擎的搜索策略 223. 1.2 垂直搜索引擎的搜索策略 243. 2 SHARK-SEARCH 算法及其改进. 253.3 试验及其结论. 303.4 基于改进 S阳RK-SEARCH 算法的 SPIDER 设计 303.5 本章小结. 31第四章搜商同文本分类器设计 324. 1 文本分类的定义 324.2 文本分类的方法 324.3 文挡分类过程 .. 334.4 经典分类模型 344.4.1 贝叶斯方法 344.4.2 刚刚护近邻算法)4.4.3 支持向量机 (SVM) 354.5 基于支持向量机的文本分类.. 384. 6 本章小结
您可能关注的文档
- 串联电池组复杂失衡控制策略分析-analysis of control strategy for complex unbalance of series battery pack.docx
- 串联调整式acac变换器的研究-research on series - regulated acac converter.docx
- 串联谐振逆变器谐振回路及负载匹配的分析-analysis of resonant circuit and load matching of series resonant inverter.docx
- 串联和并联结构的多微网系统分层主从协调控制方法分析-analysis of hierarchical master-slave coordinated control method for multi-microgrid systems with series and parallel structures.docx
- 串联式网络矩形微通道对流换热实验分析-experimental analysis of convective heat transfer in series network rectangular microchannels.docx
- 串珠镰刀菌对balbc小鼠致病性的研究-pathogenicity of fusarium moniliforme to balbc mice.docx
- 串珠镰刀菌致小鼠局部皮肤感染实验分析-experimental analysis of local skin infection caused by fusarium moniliforme in mice.docx
- 串联混合型有源电力滤波器的优化分析-optimization analysis of series hybrid active power filter.docx
- 串叶松香草的化学成分分析-analysis of chemical constituents of vanilla.docx
- 创编课在普通高校舞蹈教学中意义价值的分析-analysis of the significance and value of creative courses in dance teaching in colleges and universities.docx
- (正式版)DB33∕T 2574-2023 《 数字乡村建设规范 》.pdf
- (正式版)DB33∕T 2554-2022 《“GM2D”进口商品数据元 》.pdf
- (正式版)DB33∕T 2573-2023 《 助残护理员照护服务规范 》.pdf
- (正式版)DB33∕T 2542-2022 《餐饮计量规范 》.pdf
- (正式版)DB33∕T 2558.1-2022 《林下套种菌药生产技术规程 第1部分:大球盖菇》.pdf
- (正式版)DB33∕T 2558.3-2022 《林下套种菌药生产技术规程 第3部分:羊肚菌 》.pdf
- (正式版)DB33∕T 2575-2023 《 野生猛禽和涉禽安全救护技术规程 》.pdf
- (正式版)DB33∕T 2544-2022 《森林人家建设规范》.pdf
- (正式版)DB33∕T 310010-2021 《沿海防护林生态效益监测与评估技术规程》.pdf
- (正式版)DB33∕T 3004.1-2015 《农村厕所建设和服务规范 第1部分:农村改厕管理规范 》.pdf
原创力文档

文档评论(0)