大规模中文文本检索中的高性能索引研究.pdfVIP

  • 5
  • 0
  • 约5.58万字
  • 约 48页
  • 2017-07-03 发布于上海
  • 举报

大规模中文文本检索中的高性能索引研究.pdf

大规模中文文本检索中的高性能索引研究

太蕊攫孛丈鬟盎控素中鼹商牲鼗霞§l麟戆=摘要 摘要 涟罄笠联酾土绱息瞧举断增长枯跨蘸登龉,缝豢累缝,特澍是母文文零黢紫系缝, 楚枢蹙裂A卷j越泉越多豹关注。 索gl跫检索系绫必幂鼙争熬缀或部势,照捡囊系筑搓供抉逮囊谗服务麓美毽。蜒撵 支替照丈勰摸稳索惹统最嚣趣的索gl影式。然豫,通常撼酝_F,索;f鹩鞫建,鞠侧撵文 件豹生成,是一个{#常耗时麴避程,为了逡墩大规模的文采检索往务。豁必要研究女n恢 鞫建襄g{魏手段。 通过辩索gi迸攫静骞个除陂进行努辑,零文措怒,道鬻熬豢;}算法效犁攀搿的奎蘩 原因霄二:1)C甲u_搦I/O部棒捆豆等待,使穆系统资源的利用率不裹;2)文戡分橱阶 戳蹙整个索{i过程中韵瓶颈,特别的,辩中文文本丽言,静词是主要的开销。 铃霹第一个睡遂,辜文霞串孬静豢;l流稳中剐A渔瘩缝瑟拇,援商了蠹源蘸终热并 行程艘,进而缩短侧捧文律的生成时闻;在此纂礁t,文中还比较了流水绒结构在幂耐 参数下的性能差摊。 嚣霹嚣:令簿蘧,嚣叛鬻月}愆纯鼢爵薅结构,虢鞠终母文静分{霹遽发,烈蕊达蚕g减 少分析阶段靖辅聒销前霹弱:程拢较了A种常凳静诵冀绪约之嚣,文中攒出,鏊予竣数 缀‰辫的褥典结梅燕麓捷索}i遴度静

文档评论(0)

1亿VIP精品文档

相关文档