- 1
- 0
- 约3.86千字
- 约 24页
- 2017-12-22 发布于江苏
- 举报
基于双数组Trie(Double-ArrayTrie)的词典查询算法
基于双数组Trie(Double-Array Trie)的词典查询算法 王小飞 2004-9-17 提纲 词典查询算法简介 双数组Trie的数据结构 基于双数组Trie的词典查询算法 存在的问题及一些改进 词典查询算法简介 在汉语信息处理系统中,汉语词典查询是一个重要的基础环节,在整个处理过程中都需要频繁地访问词典以获得汉语词语知识。因此汉语词典的快速查询对整个系统的效率有着非常重要的影响。 大部分的词典结构都是基于hash方法。这种方法的关键技术在于hash函数的设计,采用合理的方式来调节数据块的分配,控制分布的均匀性,减少冲突,提高空间利用率。 词典查询算法简介 目前的几种典型词典查询方法: 1.整词二分法 2.Trie索引树法 3.逐字二分法 词典查询算法简介 整词二分法 结构:首字散列表、词索引表、词典正文 优点:数据结构简单、占用空间小。 缺点:全词匹配,效率相对来说不高。 Tire索引树法 结构:首字散列表、Trie索引树结点 优点:分词中,不需预知待查询词的长度,沿树链逐字匹配。 缺点:构造和维护比较复杂,单词树枝多,浪费了一定的空间。 逐字二分法 结构:同整词二分法 优点:查询采用逐字匹配,提高了一定的匹配效率。 缺点:由于词典结构未改变,效率的提高有限。 双数组Trie的数据结构 Trie树: Trie树是搜索树
您可能关注的文档
- 古典文论的现代解释伦理.PDF
- 古文明霸王传——物品坐标.pdf
- 古汉语中动名之间于放的功能再认识.PDF
- 古韵十足的复古婚纱照.docx
- 只需一个IO端口上的七个IO引脚.PDF
- 可乐丽集团合规手册-kuraray.PDF
- 可以删去和调换词语,但不得改变原意)(3分)①中国社.ppt
- 可瓷化三元乙丙橡胶的制备及烧蚀性能.pdf
- 可降解种膜直播对水稻生长和产量的影响.PDF
- 台中市立崇伦国民中学102学年度第二学期第七次领.doc
- 新疆塔城地区第一高级中学2025-2026学年高一下学期学情自测物理试卷(含解析).docx
- 苏教版五年级上册数学 期中检测卷.doc
- 新疆维吾尔自治区昌吉回族自治州呼图壁县2025-2026学年九年级上学期1月期末英语试题(含解析).docx
- 新疆维吾尔自治区和田地区和田市2025-2026学年上学期八年级英语期末试卷(含解析).docx
- 四川省绵阳市游仙区2025-2026学年七年级上学期1月期末英语试题(含解析).docx
- 苏教版三年级上册数学 第三单元测试题.doc
- 四川省绵阳市梓潼县2025-2026学年八年级上学期1月期末物理试题(含解析).docx
- 四川省绵阳市盐亭县四校联考2025-2026学年八年级下学期物理学情自测(含解析).docx
- 房颤患者太极拳练习.pptx
- 苏教版五年级上册数学 期末检测卷.doc
原创力文档

文档评论(0)