基于nutch搜索引擎的中文分词算法分析与实现-analysis and implementation of chinese word segmentation algorithm based on nutch search engine.docxVIP
- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于nutch搜索引擎的中文分词算法分析与实现-analysis and implementation of chinese word segmentation algorithm based on nutch search engine
优秀毕业论文
精品参考文献资料
目 录
HYPERLINK \l _bookmark0 1 绪论 1
HYPERLINK \l _bookmark1 1.1 课题背景 1
HYPERLINK \l _bookmark2 1.2 分词对搜索引擎的重要性 1
HYPERLINK \l _bookmark4 1.3 中文分词现状 3
HYPERLINK \l _bookmark5 1.4 中文分词的应用 4
HYPERLINK \l _bookmark6 Nutch 搜索引擎 5
HYPERLINK \l _bookmark8 Nutch 网络蜘蛛 5
HYPERLINK \l _bookmark10 Nutch 网络蜘蛛工作流程 7
HYPERLINK \l _bookmark11 1.6 论文结构 8
HYPERLINK \l _bookmark12 2 中文分词概述 9
HYPERLINK \l _bookmark13 2.1 中文分词理论基础 9
HYPERLINK \l _bookmark14 2.1.1 中文分词概念 9
HYPERLINK \l _bookmark15 2.1.2 中文分词系统的评价标准 9
HYPERLINK \l _bookmark16 2.2 中文分词算法 10
HYPERLINK \l _bookmark17 2.2.1 基于字符串匹配的分词方法 10
HYPERLINK \l _bookmark21 2.2.2 基于统计的分词方法 14
HYPERLINK \l _bookmark22 2.2.3 基于理解的分词方法 15
HYPERLINK \l _bookmark23 2.3 中文分词的难点 16
HYPERLINK \l _bookmark24 2.3.1 分词规范问题 16
HYPERLINK \l _bookmark25 2.3.2 歧义识别 17
HYPERLINK \l _bookmark26 2.3.3 未登录词识别 17
HYPERLINK \l _bookmark28 2.4 小结 18
HYPERLINK \l _bookmark29 3 中文分词的核心技术 19
HYPERLINK \l _bookmark30 3.1 中文分词流程 19
HYPERLINK \l _bookmark31 3.2 分词算法衡量标准 19
HYPERLINK \l _bookmark32 3.3 词典机制 19
HYPERLINK \l _bookmark33 3.4 分词算法优化 20
HYPERLINK \l _bookmark34 3.4.1 基于首字 hash 的匹配算法 20
HYPERLINK \l _bookmark39 3.4.2 基于首字最长词条匹配算法 23
HYPERLINK \l _bookmark44 3.4.3 基于首字最长词条匹配算法的改进 26
HYPERLINK \l _bookmark50 3.5 小结 29
HYPERLINK \l _bookmark51 4 中文分词在 Nutch 中的应用 30
HYPERLINK \l _bookmark52 4.1 Nutch 中文分词 30
HYPERLINK \l _bookmark53 4.1.1 Nutch 自带中文分词 30
HYPERLINK \l _bookmark54 4.1.2 Nutch 中添加中文分词插件 30
HYPERLINK \l _bookmark55 4.2 Nutch 搜索引擎搭建 32
HYPERLINK \l _bookmark56 4.2.1 开发软件介绍 32
HYPERLINK \l _bookmark57 4.2.2 Nutch 搭建流程 32
HYPERLINK \l _bookmark60 4.3 中文分词结果验证 34
HYPERLINK \l _bookmark62 4.3.1 luke 工具简介 35
HYPERLINK \l _bookmark63 4.3.2 分词结果验证 35
HYPERLINK \l _bookmark65 4.4 小结 36
HYPERLINK \l _bookmark66 5 总结与展望 37
HYPERLINK \l _bookmark67 5.1 总结 37
HYPERLINK \l _bookmark68 5.2 展望 37
HYPERLINK \l _bookmark69 致 谢 38
HYPERLINK \l _bookmark70 参
您可能关注的文档
- 基于gprs技术的景观照明远程监控系统的分析-analysis of landscape lighting remote monitoring system based on gprs technology.docx
- 基于gprs三表远程监测控制系统设计-design of remote monitoring and control system based on gprs three tables.docx
- 基于gprs的无线监控网关的分析与实现-analysis and implementation of wireless monitoring gateway based on gprs.docx
- 基于gprs及彩信的远程监控装置的分析与实现-analysis and implementation of remote monitoring device based on gprs and mms.docx
- 基于gprs智能家居远程网络监控系统的分析-analysis of gprs - based smart home remote network monitoring system.docx
- 基于gprs的远程状态监测技术分析-analysis of remote status monitoring technology based on gprs.docx
- 基于gpsgis车辆定位导航系统的研究-research on vehicle positioning and navigation system based on gps gis.docx
- 基于gpsgisgsm的车辆监控系统设计及应用-design and application of vehicle monitoring system based on gpsgiswgsm.docx
- 基于gprs定型机排气余热回收计量监测系统-measurement and monitor system for exhaust waste heat recovery of molding machine base on gprs.docx
- 基于gps的机车头灯自动寻迹系统控制算法的分析-analysis of control algorithm for automatic tracking system of locomotive headlights based on gps.docx
- 基于nsct和支持向量机的纹理特征识别方法分析-analysis of texture feature identification method based on nsct and support vector machine.docx
- 基于ocdm中混合1d2d的pon系统-pon system based on mixed 1d2d in ocdm.docx
- 基于ocdm中periodic encoders的pon系统监控技术的分析-analysis of pon system monitoring technology based on periodic encoder in ocdm.docx
- 基于ofdm-rof系统的数字预失真研究-research on digital predistortion based on ofdm - rof system.docx
- 基于nfc协议应用在手机上设计与实现-design and implementation of nfc - based application on mobile phones.docx
- 基于niosⅱ软核处理器遥测图像采集存储系统设计与实现-design and implementation of remote sensing image acquisition and storage system based on nios ⅱ soft core processor.docx
- 基于or1200的嵌入式soc以太网网关的分析与设计-analysis and design of embedded soc ethernet gateway based on or 1200.docx
- 基于openflow网络的分层路由技术分析-analysis of layered routing technology based on openflow network.docx
- 基于ota技术手机参数配置系统设计与实现-design and implementation of mobile phone paramete configuration system based on ota technology.docx
- 基于opencv集装箱加强板焊接自动定位系统开发-development of automatic location system of container stiffener welding based on opencv.docx
最近下载
- 手术室规章制度33项汇编.pdf VIP
- “互联网+”背景下高校辅导员学业指导与职业规划工作的创新-来源:现代职业教育(高职高专)(第2020040期)-山西教育教辅传媒集团有限责任公司.pdf VIP
- 劳动实践(教案)二年级上册综合实践活动全国通用.docx VIP
- 2024年湖北省华师一附中自主招生数学试题(d含答案).pdf VIP
- 新教科版六上科学1-2《怎样放得更大》练习题(含答案).docx VIP
- 冶金消防安全知识课件.pptx
- 《电力设备典型消防规程》(DL5027—2024).pptx VIP
- 罗马城邦和罗马帝国ppt课件.pptx VIP
- 迅达5400综合系统介绍(2).pdf
- 新教科版六上科学知识点+练习题-1.2《怎样放得更大》.doc VIP
文档评论(0)