- 7
- 0
- 约5.56千字
- 约 45页
- 2018-09-17 发布于湖北
- 举报
词典精选版.ppt
Wordnet 3 规模 名词:80,000 words, 60,000 synsets 形容词:16,000 synsets 动词:11,500 synsets 还在不断发展之中 * yjyuuy WordNet 4—名词概念的组织 * yjyuuy WordNet 5—形容词概念的组织 * yjyuuy 词典检索算法1 词典检索算法的性能评价 时间复杂度 空间复杂度 检索方式 直接用词语检索 检索句子中某个位置开始的所有词 检索句子中某个位置开始的最长词 模糊检索 …… 增量式索引 * yjyuuy 词典检索算法2 两个问题 索引结构 查找算法 一种索引结构可以对应不同的查找算法 * yjyuuy 词典顺序索引 * yjyuuy 词典顺序索引的查找算法 整词二分查找 时间复杂度O(log2N) 无法按前缀查找 改进的整词二分查找 时间复杂度O(log2N) 可以实现按前缀查找 * yjyuuy 词典散列索引 * yjyuuy 词典散列索引的检索算法 利用散列(hash)函数直接定位 效率高:常数 不能按前缀查找 冲突的解决 使用冲突队列 使用再散列 散列函数(hash)的选择 算法改进:逐词散列,可以实现按前缀查找 * yjyuuy 词典分级索引 将词语分成若干部分,为每一部分分别建立索引 在分级索引中,每一级索引都可以采用各种不同的索引和查找算法 对于汉语而言,第一级索引一
原创力文档

文档评论(0)