搜索引擎开发践实01.pptVIP

  • 3
  • 0
  • 约9.34千字
  • 约 42页
  • 2017-03-23 发布于四川
  • 举报
概 述 前导知识 搜索引擎的查询语法 搜索引擎的总体架构 用户界面布局 网站搜索的常用功能 准备开发环境 JDK1.6 增加虚拟内存到800M -Xmx800m Eclipse /babel/downloads.php 支持中文的语言包 Lucene /java/docs/index.html Resin /download 准备开发环境(续) TortoiseSVN Ant Maven Linux CentOS() SecureCRT登录 词法分析(Lexical analysis) 例如分析输入的用户查询串,输出该字符串中出现的所有的合法的单词(Token)。例如对查询串“NBA AND 比赛”的词法分析: Token NBA AND 比赛 Type TERM AND TERM Lucene中采用JavaCC实现词法分析。 JavaCC有个Eclipse插件(/) 词法分析的原理 生成词法分析器 词法分析器如何工作? 把用户输入定义的Token转换成为正规文法等价的形式 把正规文法转换成NFA 把NFA转换成DFA 生成代码模拟DFA 语法分析 词法分析-JavaCC JavaCC(Java Com

文档评论(0)

1亿VIP精品文档

相关文档