- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
循证医学信息化若干关键技术的研究.pdf
第 26 卷第 3 期
2008 年 9 月
广西师拖大学学报 z 自然科学版
Journal of Guangxi Normal University:Natural Science Edition
循证医学信息化若干关键技术的研究
李丹._明羽,时丽莎
〈大连海事大学信息科学技术学院,辽宁大连 116026)
Vol. 26 No.3
Sept.2008
摘 W: 由于 Web 倍息俭索返回贸丽的数量巨大,对搜索结果进行排序成为影响搜索质量的一个重要问题。
分析了搜索引擎 Google 采用的 PageRank 算法,指出其具有偏道旧网}j{和忽视专业站点的不足,考虑网页日
期这一重要因素改进了 PageRank 算法,试验结果表明,改进的算法可以提高判断网页重要性的准确度,最后
介绍了如何通过个性化服务来发现与用户兴趣相似的资源.
关键词 g搜索引擎 p 网页排序 z崩链接IPageRank,个性化服务
中阳分提号:TP391 文献标识码 :A 文章蝙号:1001-6600(2008)03-0210心4
随着倍息技术相互联闷的飞速发展,目前国际上提供大量常见疾病的循证睦学最佳证据的信息资糠
正在快速增长。已有几千家国际性、专业化的循证医学网捕、杂志、软件公词等提供大麓循话E~学病例证
据、系统评价、循证指南等循证医学信息资惊和服务[110 传统的搜索引瞥如 Google 、 Fast , Alta Vista 和 Go
To 等正面临巨大挑战.-刷刷是 Web 倍息资糠虽几何数级增伏,擅索引擎无法索引所有页面;二是 Web 倍息
资斓的胡态变化,搜索引擎无法保证对倍息的及时更新 F正是传统的搜索引擎不能满足人们对个性化倍息
检索服务日益增长的需要。
本文首先简单介绍奋询结果树的构造算法阳及检索结果的树形展示 s接着详细介锦检索结果的排序
方法[3-6J;最后介绍个性化倍息推荐技术[1]
1 查询结果树的构造算法及检索结果的树形展示
搜缴引擎用户查询需求是多种多样的,而搜索结果情息显示经常采用树形层次逻辅结构来我放信息
的栏目级联关系,从而达到直观和结构清晰的功效。下面讲述一种树形结构显示数据糠的算怯。
1.1 班询结果树的构涌算法
查询结果树的构造果用了 Hash 藉,宽要用割的散据结构可描谴为: 10 , Ooc) ,其中 10 为 Key , Ooc
为 Value.l0 是某一愿次分类倍息对应的标识;Doc 是该分樊信息下满足查询条件的 Web 文档集合(正文
叶子集〉和其子类倍息。
查询结果树的构遣算法捕述如下 z
While 检索结果 Hash 我不结
检索结果 Hash 囊中取出一个冗景 1口, Ooc);
lF 结果树中含有 Key 为 10 的元素
将Doc 迫加剧结果树中 Key 为 ID 的 Value 中 s
ELSE
以 ID 为 Key , Doc 为 Value 新建树结点 node ,
将 ID 的父销点对应的类别栋识记为 F 即 ID;
While F ID 不为~and 结果树中不含以 F … ID 为 Key 的元素
收稿日期: 2008-06-06
基金项目 g国家自然科学基金赞助项目 ,,
通讯联系人 z鲁明羽 (1963一).身,黑龙江哈尔滨人,大连海事大学教授,博士. E-mail:lumingyu@
第 3 期 李 丹等 z循证医学信息化若干关键技术的研究
以 F … ID 为 Key ,ID 为 Value 建立樊别间屡次关系 s
Temps=F _ ID;
F _ID:=F … ID 的父结点 s
End While
IFF_ID 不为空
将 Temp 迫加到结果树中 Key 为 F _ ID 的 Value 中$
End IF
End IF
End While
211
检索结果OD ,Doc)最终以分类条目 ID 为索引,具有了完黯的树形层次结构,为结果展示提供了很好
的数据结构支持。
1.2 检索结果的树形展和
为了实现这种查询结果,系统采用以下 3 步实现查询 z
①引入一个树那元素铺构存储结构,如临时表或者数组,该存储结构的数据同树形铺构中所有数据元
素一一对应。
@从 HTML CONTENT 库中提取出符合记录捕入树型元素结构存储结构。
@对树剩无素结构存储结构内的原始数据按栏目代阔的级别进行逐级汇总、更新。,
2 检索结果排序方法
搜索引擎的排序方怯直接影响着拽索引擎的检索效果,如果幢索引驾醺甚能够按照检索铺果的相关度大
小对检索结果进行排序,将节省用卢在缩果集中筛选自巳所需倍息的时间,附搜索寻引|擎 Go∞og副le 所呆用的
Pag伊eRank[3ω3叫,
2.1 Pag
您可能关注的文档
- 口服4%泛影葡胺葛根粉糊螺旋CT扫描诊断食管癌的临床应用.pdf
- 含非线性吸收的串级结构z扫描技术理论分析.pdf
- 周围型肺癌的早期诊断-CT扫描结合痰液肿瘤标志物检测.pdf
- 国产光栅近红外光谱仪扫描条件对检测结果的影响.pdf
- 多层螺旋CT低剂量扫描肺容积和肺密度定量分析的可行性研究.pdf
- 履行知情同意涉及法律问题的若干意见.pdf
- 山羊肾微血管构筑的扫描电镜观察.pdf
- 岩石疲劳破坏的变形控制律、岩土力学试验的实时X射线CT扫描和边坡坝基抗滑稳定分析的新方法.pdf
- 崂山风景区土壤重金属元素环境容量的计算.pdf
- 工业辐照加速器扫描磁铁电源的研制.pdf
- 航空工业航空信息化建设分析及2025年发展前景报告.docx
- 2025年细胞治疗行业法规与标准制定最新动态解读报告.docx
- 基因治疗临床试验监管政策对临床试验药物研发产业的影响分析报告.docx
- 2025年金融科技平台合规性建设与金融科技监管政策实施研究报告[001].docx
- B2B企业商机质量提升方案及实施效果报告.docx
- 短视频平台内容传播效果与短视频内容传播机制研究报告.docx
- 2025年视角下生物医药冷链物流行业标准建设与未来十年市场扩张分析报告.docx
- 字节跳动短视频行业发展趋势与政策分析报告.docx
- 2025年视角下电子化学品国产化关键技术与市场前景报告.docx
- 2025年金融机构理财产品创新与区块链技术融合可行性分析报告.docx
文档评论(0)