- 3
- 0
- 约4.81千字
- 约 8页
- 2018-08-27 发布于江苏
- 举报
期间查看了该包的源码并作了一些分析,现在贴出来以供参
我的毕业设计是基于全文检索引擎工具包Luncene的analysis包而实现的,期间查看了该包的源码并作了一些分析,现在贴出来以供参考。
注:这里分析的只是analysis包的一些基本类,而不是全部。
1、Token类:
package?org.apache.lucene.analysis;
public?final?class?Token{
String?termText;??//?词项文本(the?text?of?the?term)
int?startOffset;??//?Token在源文本中的起始位置(start?in?source?text)
int?endOffset;??//?Token在源文本中的结束位置(end?in?source?text)
String?type?=?word;?//~?Token的词类型,默认是word(lexical?type,?default?is?word)
//:?附:lexical?type:
//:?single?=?ASCII
//:?double?=?non-ASCII
//:?word???=?default
private?int?positionIncrement?=?1;?//?位移增量,即TokenStream里当前Token与
//??先前某一个Token之间的位移差,默认为1
//~?第一个构造器
public?Token(String?text,?int?start,?int?end){
termText?=?text;
startOffset?=?start;
endOffset?=?end;
}
//~?第二个构造器
public?Token(String?text,?int?start,?int?end,?String?type){
termText?=?text;
startOffset?=?start;
endOffset?=?end;
this.type?=?type;
}
//~?设置位移增量方法
public?void?setPositionIncrement(int?positionIncrement){
if(?positionIncrement??0?)
throw?new?IllegalArgumentException(
Increment?must?be?zero?or?greater:??+?positionIncrement);
this.positionIncrement?=?positionIncrement;
}
//~?获取位移增量
public?int?getPositionIncrement()?{?return?positionIncrement;?}
//~?获取词项文本
public?final?String?termText()?{?return?termText;?}
//~?获取Token的起始位置
public?final?int?startOffset()?{?return?startOffset;?}
//~?获取Token的结束位置
public?final?int?endOffset()?{?return?endOffset;?}
//~?获取Token的词类型
public?final?String?type()?{?return?type;?}
//~?重载基类(Object)的toString()方法
public?final?String?toString(){
StringBuffer?sb?=?new?StringBuffer();
sb.append((?+?termText?+?,??+?startOffset?+?,??+?endOffset);
if(?!type.equals(word)?)
sb.append(,?type=?+?type);
if(?positionIncrement?!=?1?)
sb.append(,?posIncr=?+?positionIncrement);
sb.append());
return?sb.toString();
}
}?///:~
2、TokenStream类:
package?org.apache.lucene.analysis;
import?java.io.IOException;
/**
*?一个TokenStream是枚举tokens的序列,或者从文档的字段、查询文本枚举的
您可能关注的文档
- 早班服务员地工作任务明细单.doc
- 早稻塑盘保温育秧毛霉菌的发生与防治1.ppt
- 早籼稻的供给和需求.doc
- 时代发展线岱岳纺织院墙栏杆加固及零星工程2.doc
- 时差信徒:给z先生的1封情书1.doc
- 时基555集成路原理与应用.ppt
- 早稻田大学的信化战略.ppt
- 时间序列分析试题8.doc
- 昆山市国民经济与社会发展“十一五”规划纲要草案.doc
- 时间管理--业一部黄敏.ppt
- 2025~2026学年江苏省苏州市某校苏教版(小升初)考试数学试卷【附解析】.docx
- 2026届陕西省岐山县市级名校中考一模语文试题含解析.doc
- 2025~2026学年江苏省宿迁市沭阳县刘集镇苏教版六年级下册期中考试数学试卷【附解析】.docx
- 城市道路设计课件:城市道路附属设施设计 .pptx
- 2026届山东省邹平市中考语文全真模拟试题含解析.doc
- 2025-2026学年第二学期体育工作迎检总结报告:展示学校体育教育成果.docx
- 2026届广东省广州各区达标名校中考二模英语试题含答案.doc
- 2025~2026学年江苏省宿迁市沭阳县苏教版六年级下册期中考试数学试卷【附解析】.docx
- 浙江省绍兴市重点名校2026届中考适应性考试历史试题含解析.doc
- 2025~2026学年湖南省张家界市永定区人教版五年级上册期末数学检测试卷【附解析】.docx
原创力文档

文档评论(0)