中文分词安装实现中文全文.doc

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
中文分词安装实现中文全文

Sphinx Mysql 中文分词安装 实现中文全文 Sphinx+Mysql+中文分词安装-实现中文全文搜索2010-03-30 16:45什么是Sphinx Sphinx是一个在GPLv2下发布的一个全文检索引擎,商业授权(例如,嵌入到其他程序中)需要联系我们(S)以获得商业授权。一般而言,Sphinx是一个独立的搜索引擎,意图为其他应用提供高速、低空间占用、高结果相关度的全文搜索功能。Sphinx可以非常容易的与SQL数据库和脚本语言集成。当前系统内置MySQL和PostgreSQL数据库数据源的支持,也支持从标准输入读取特定格式的XML数据。通过修改源代码,用户可以自行增加新的数据源(例如:其他类型的DBMS的原生支持)。搜索API支持PHP、Python、Perl、Rudy和Java,并且也可以用作MySQL存储引擎。搜索API非常简单,可以在若干个小时之内移植到新的语言上。Sphinx是SQL Phrase Index的缩写,但不幸的和CMU的Sphinx项目重名 Sphinx的特性 高速的建立索引(在当代CPU上,峰值性能可达到10 MB/秒); 高性能的搜索(在2– 4GB的文本数据上,平均每次检索响应时间小于0.1秒); 可处理海量数据(目前已知可以处理超过100 GB的文本数据,在单一CPU的系统上可处理100 M文档); 提供了优秀的相关度算法,基于短语相似度和统计(BM25)的复合Ranking方法; 支持分布式搜索; provides document exceprts generation; 可作为MySQL的存储引擎提供搜索服务; 支持布尔、短语、词语相似度等多种检索模式; 文档支持多个全文检索字段(最大不超过32个); 文档支持多个额外的属性信息(例如:分组信息,时间戳等); 停止词查询; 支持单一字节编码和UTF-8编码; 原生的MySQL支持(同时支持MyISAM和InnoDB); 原生的PostgreSQL支持.一、安装所需文件mmseg-0.7.3.tar.gz中文分词mysql-5.1.26源代码 sphinx-0.9.8-rc2.tar.gz sphinx-0.9.8-rc2源代码sphinx支持分词补丁sphinx支持分词补丁二、开始安装1.安装libmmseg tar-zxvf mmseg-0.7.3.tar.gzcd mmseg-0.7.3./configure--prefix=/usr/local/mmsegmakemake installcd.安装mmseg完成,测试一下 mmsegCoreseek COS(tm)MM Segment 1.0Usage:mmseg option file-u unidict Unigram Dictionary-r Combine with-u,used aplain text build Unigram Dictionary,default Off-b Synonyms Synonyms Dictionary-h print this help and exit有问题可以尝试执行下面命令 echo/usr/local/mmseg/lib/etc/ld.so.confldconfig-vln-s/usr/local/mmseg/bin/mmseg/bin/mmseg2.重新编译mysql在安装之前先打两个补丁,这个是支持中文必须打的补丁 tar-zxvf sphinx-0.9.8-rc2.tar.gzcd sphinx-0.9.8patch-p1./sphinx-0.98rc2.zhcn-support.patchpatch-p1./fix-crash-in-excerpts.patch之前我已安装了mysql 5.1.26,这里略过具体安装步骤mysql编译路径/root/lemp/mysql-5.1.26-rc/mysql安装路径/opt/mysql 安装之前关闭mysql /opt/mysql/bin/mysql.server stop接着将sphinx下的mysqlse文件夹下的数据拷贝到mysql-5.1.26-rc/storage/sphinx下面(这样才能在编译mysql的时候把SphinxSE存储引擎编译进去) c p-rf mysqlse/root/lemp/mysql-5.1.26-rc/storage/sphinxcd/root/lemp/mysql-5.1.26-rcmake cleansh BUILD/autorun.sh#这步是必须的,请勿遗漏开始重新编译 CFLAGS=-O3CXX=gcc CXXFLAGS=-O3-felide-constructors-fno-exceptions-fno-rtti./co

文档评论(0)

manyu + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档