- 2
- 0
- 约 7页
- 2016-11-23 发布于贵州
- 举报
网络信息检索与搜引擎系统开发
《网络信息检索与搜素引擎系统开发》考试参考资料 Brilliance
搜索引擎:从互联网等信息源中以一定的策略采集所需信息,经加工处理(如对网页进行去重处理、抽取信息、索引、生成主题词标引、生成自动文摘、信息分类、对相似网页进行聚类等),将用户感兴趣的内容按照一定的规则排序后,以超链等形式提供给用户的系统。
搜索引擎主要包括信息采集、信息加工、信息检索与检索结果提供这几个部分
搜索引擎分类:目录索引式搜索引擎、自动式搜索引擎、元搜索引擎、分布式搜索引擎
自动搜索引擎:
利用Robot采集相关网页。在进信息加工后(如:分析页面内容;生成索引; 摘要;分类),根据用户给出的查询项进行检索,并将检索结果按相关性排 序(可根据匹配程度、查询项出现的位置/频次、网页链接质量等)后返回 给用户。
?优点:自动采集,信息量大,更新较及时。
?缺点:检索时缺乏在语义层次上的深层分析。
?查准率查准率(precision)用来评价检索结果中有多少文档是和用户需求相关的。
查准率=检索结果中和查询相关的文档数÷检索结果中的文档总数×100%
?查全率查全率:文档库中所有相关文档中到底有多少被系统检索出来
查全率=检索结果中和查询相关的文档数÷文档库中所有和查询相关的文档数×100%
网络信息检索的未来:
1.以智能化为核心的智能检索
2.多媒体信息检索
3
您可能关注的文档
- 线性代数0219自考2009年~2012年真题试题及答案(新).doc
- 线性代数期末试题参考答案1.doc
- 线性代数引论(内生)A卷试题及答案 2010.1.doc
- 线性代数习题及答-华南理工大学工版.doc
- 线性代数复习题部参考答案.doc
- 线性代数在线练习和50%答案.doc
- 线性代数综合练习及答案10.doc
- 线性代数试题和答(精选版).doc
- 线性代数经典试题套及答案.doc
- 线性表的操作与应(算法与数据结构课程设计).doc
- 专项十三 复合句(含答案) 2026年中考人教版英语语法专项复习.doc.docx
- 专项十四 There be句型和主谓一致(含答案) 2026年中考人教版英语语法专项复习.doc.docx
- 专项14 构词法 学案(含答案)2025年中考人教版英语语法专项复习.doc.docx
- 静脉肾盂造影结石梗阻评估.ppt
- 《假期实践活动》教案-2025-2026学年冀教版(新教材)小学数学二年级下册.docx
- 老年结石病合并慢病综合诊疗.ppt
- 鹿角形肾结石复杂手术治疗.ppt
- 经皮肾镜超声碎石清石术.ppt
- 《参观爱国主义教育基地》教案-2025-2026学年冀教版(新教材)小学数学二年级下册.docx
- 《生活中的大数:整理与复习》教案(2课时)-2025-2026学年冀教版(新教材)小学数学二年级下册.docx
最近下载
- 工业视觉AOI智能检测装备相关项目运营指导方案.docx
- 高铁站装修施工方案.docx VIP
- 燃气管道工程施工测量及竣工测量方案.docx VIP
- 2025年数字乡村补贴申领全流程课件 符合条件都能拿到钱.pptx VIP
- 数控加工中心五级保养内容.docx VIP
- {旅游行业管理}西双版纳国家级自然保护区生态旅游总体规划125页.pdf VIP
- 2026入团积极分子考试200题题库(含答案).docx
- 2026年北京市顺义区初三一模数学试卷(含答案).pdf
- 经济学原理曼昆pdf.pptx VIP
- 2025年军队文职招聘-军队文职技能岗-军队文职招聘(炊事员/食堂管理员)历年参考题典型考点含答案解.docx VIP
原创力文档

文档评论(0)