- 8
- 0
- 约7.03千字
- 约 42页
- 2017-08-14 发布于江苏
- 举报
多关键字全文检索大作业分析讲评 2009/05/05 作业要求: 要求; ?按向量空间模型实现诗歌的检索,系统可以支持对任意指定的一组词(a bag of word),检索出最符合条件的诗歌(前十首,按相似度降序)。能够实现词(出现)匹配计算并完成系统并有较详细注释的,可以获得+2分。 考虑词频以及tf,idf并附有较详细报告与注释的可获得+3分。 能够综合考虑位置及其他信息,支持简单逻辑表达式进行检索运算的,并完成详细的设计报告者,可获得+4到5分。 提交情况 叶永鑫 骆文珊 张国晟 张潇云 唐紫薇 徐腾 陈刚 饶驰通 题目理解与分析: 待处理数据: 行号 -1 0 1,2,3,4,… 起始位置 词条 程序实现:(张国晟 ) 申请空间,读入数据: 运行初始化: Split: Dictionary+Postings 每出现新词条, 添加词典 每出现新词条, 添加postings 词条文档号重复, postings + 1 多关键码排序 词条权重: 图 — 基本概念与抽象数据类型 2009/05/5 主要内容 图的基本概念 图的相邻矩阵及邻接表的表示方法 图抽象数据类型 图的周游方法 求图的最小生成树(林) 图的基本概念 反映连通关系 反映连通属性 图的形式化定义 图由顶点(vertex)集合和边(edge)集合E组成, 记为G=(V,E)。 每条
原创力文档

文档评论(0)