- 0
- 0
- 约1.41万字
- 约 3页
- 2019-12-29 发布于天津
- 举报
第 8 期 肖 红等: 具有三级索引词库结构的中文分词方法研究 ·49 ·
*
具有三级索引词库结构的中文分词方法研究
肖 红, 许少华, 李 欣
( 大庆石油学院 计算机科学系, 黑龙江 大庆 163318)
摘 要: 提出了一种分组并具有三级索引结构的词库组织体系, 给出了合适的索引密度间隔; 针对系统基本词
库的扩充问题 , 考虑了一种基于词频统计并具有过滤功能的关键词自动抽取和小词条添加方法。大量仿真实验
结果表明, 采用该方法可较大提高中文文本的切词速度及信息的查全查准率。
关键词: 中文切词; 正向最大匹配; 词库; 索引密度; 全文检索
中图法分类号: TP391 文献标识码 : A 文章编号 : 1001- 3695( 2006) 08- 0049- 03
您可能关注的文档
最近下载
- IRIS质量管理体系文件宣贯培训.doc VIP
- 小学英语新外研版四年级下册Unit 4 Plant life第1课时教学课件(2026春).pptx VIP
- 9.1科学立法 课件-高中政治统编版必修三政治与法治.pptx
- 《推动全民阅读,建设书香社会》.ppt
- 12J201平屋面建筑构造.docx VIP
- 2026年高考化学一轮复习备考策略讲座.pptx VIP
- 重庆市2026届高三下学期4月高考模拟调研(五)语文试卷(含答案).docx VIP
- 课题申报书:四川方言口传文化的传承普及与乡土记忆重建研究.docx VIP
- 16G101三维图集第七章基础建筑图集.docx VIP
- 2025年重庆教师公开招聘考试考试真题卷 .pdf VIP
原创力文档

文档评论(0)