- 4
- 0
- 约3.86千字
- 约 24页
- 2018-07-30 发布于江苏
- 举报
基于双数组Trie(Double-ArrayTrie)地词典查询算法
基于双数组Trie(Double-Array Trie)的词典查询算法 王小飞 2004-9-17 提纲 词典查询算法简介 双数组Trie的数据结构 基于双数组Trie的词典查询算法 存在的问题及一些改进 词典查询算法简介 在汉语信息处理系统中,汉语词典查询是一个重要的基础环节,在整个处理过程中都需要频繁地访问词典以获得汉语词语知识。因此汉语词典的快速查询对整个系统的效率有着非常重要的影响。 大部分的词典结构都是基于hash方法。这种方法的关键技术在于hash函数的设计,采用合理的方式来调节数据块的分配,控制分布的均匀性,减少冲突,提高空间利用率。 词典查询算法简介 目前的几种典型词典查询方法: 1.整词二分法 2.Trie索引树法 3.逐字二分法 词典查询算法简介 整词二分法 结构:首字散列表、词索引表、词典正文 优点:数据结构简单、占用空间小。 缺点:全词匹配,效率相对来说不高。 Tire索引树法 结构:首字散列表、Trie索引树结点 优点:分词中,不需预知待查询词的长度,沿树链逐字匹配。 缺点:构造和维护比较复杂,单词树枝多,浪费了一定的空间。 逐字二分法 结构:同整词二分法 优点:查询采用逐字匹配,提高了一定的匹配效率。 缺点:由于词典结构未改变,效率的提高有限。 双数组Trie的数据结构 Trie树: Trie树是搜索树
您可能关注的文档
- 国资发力P2P贷 缺少互联网基因或成最大阻碍.pptx
- 国道331线二连浩特至艾勒格庙段4.doc
- 国道明沈线拐脖店至望宝桥段4.doc
- 国道特色专题数据库超市系统使用方法和技巧TheMethods3.ppt
- 国防工办电子设备装接工理论知识复习题3.doc
- 国防外交科教文化和社会生活3.doc
- 国防科技奖学金评审部署1.ppt
- 国际业余拳击联合会(AIBA)地主要赛事.doc
- 国际人力资源管研讨从明碁电脑探讨.ppt
- 国际会计1班小组成员吴宗洁、闫孝冉、何欣雨、马金昊、.ppt
- 4.4 控制系统的设计与实施(教学设计)高中通用技术苏教版2019必修2.docx
- 2026届衡水市第十三中学高三第一次质量调研(一模)数学试题.doc
- 3.1.1关系数据结构及关系代数教学设计-浙教版高中信息技术选修三.docx
- 高考化学二轮复习 阿伏伽德罗常数.docx
- 运筹学期末复习完全手册(直接使用版).docx
- 人工肝治疗中的家属支持与护理.pptx
- 人工肝治疗后的康复护理.pptx
- 4 自由落体运动(表格式教学设计)高中物理人教版2019必修第一册.docx
- 第05讲 充分条件、必要条件、充要条件(八大题型)新高一数学(苏教版2019必修第一册).docx
- 29 古代诗歌文本比较鉴赏题(比较形象、语言、表达技巧、情感态度)高考语文二轮复习专题.docx
最近下载
- 细菌及细菌类疾病的实验室诊断—细菌标本片的制备及染色方法(动物微生物技术课件).pptx
- DB32_T 3610.1-2025 道路运输车辆智能监控系统技术规范 第1部分:平台.docx VIP
- 山药根结线虫病测报调查技术规程.docx VIP
- 《电力建设工程预算定额章节说明》(2018年版) 第一册 建筑工程 下册.pdf VIP
- 《创新的扩散》(diffusion of innovation)(英文.文字版).pdf VIP
- 王蔷主编的《英语教学法教程》第二版-Unit-1.pdf VIP
- 《电力建设工程预算定额章节说明》(2018年版)第一册建筑工程.pdf VIP
- 山药根结线虫病测报调查技术规程.docx VIP
- 产品合格证模板-A4.doc VIP
- 入党志愿书(全电子版).pdf VIP
原创力文档

文档评论(0)