- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
sphinx全文检索之PHP使用教程讲解
sphinx全文检索之PHP使用教程
这是半年前没有对外写的文章,现在拿出来分享下。可能会有一些不正确或不严谨的地方,某些语言可能比较轻浮,请见谅。以上一篇的email数据表为例:数据结构:
CREATE TABLE email (
emailid mediumint(8) unsigned NOT NULL auto_increment COMMENT 邮件id,
fromid int(10) unsigned NOT NULL default 0 COMMENT 发送人ID,
toid int(10) unsigned NOT NULL default 0 COMMENT 收件人ID,
content text unsigned NOT NULL COMMENT 邮件内容,
subject varchar(100) unsigned NOT NULL COMMENT 邮件标题,
sendtime int(10) NOT NULL COMMENT 发送时间,
attachment varchar(100) NOT NULL COMMENT 附件ID,以逗号分割, PRIMARY KEY (emailid),
) ENGINE=MyISAM;
使用打开控制台,必需打开控制台PHP才能连接到sphinx(确保你已经建立好索引源):d:\coreseek\bin\searchd -c d:\coreseek\bin\sphinx.confcoreseek/api目录下提供了PHP的接口文件 sphinxapi.php,这个文件包含一个SphinxClient的类在PHP引入这个文件,new一下
$sphinx = new SphinxClient();
//sphinx的主机名和端口
$sphinx-SetServer ( loclahost, 9312 );
//设置返回结果集为php数组格式
$sphinx-SetArrayResult ( true );
//匹配结果的偏移量,参数的意义依次为:起始位置,返回结果条数,最大匹配条数
$sphinx-SetLimits(0, 20, 1000);
//最大搜索时间
$sphinx-SetMaxQueryTime(10);
//执行简单的搜索,这个搜索将会查询所有字段的信息,要查询指定的字段请继续看下文
$index = email //索引源是配置文件中的 index 类,如果有多个索引源可使用,号隔开:email,diary 或者使用*号代表全部索引源
$result = $sphinx-query (搜索关键字, $index);
echo
;
print_r($result);
echo
;$result是一个数组,其中total是匹配到的数据总数量matches是匹配的数据,包含id,attrs这些信息words是搜索关键字的分词你可能奇怪为什么没有邮件的内容这些信息,其实sphinx并不会返回像mysql那样的数据数组,因为sphinx本来就没有记录完整的数据,只记录被分词后的数据。具体还要看matches数组,matches中的ID就是指配置文件中sql_query SELECT语句中的第一个字段,我们配置文件中是这样的sql_query = SELECT emailid,fromid,toid,subject,content,sendtime,attachement FROM email所以matches中的ID是指emailid至于weight是指匹配的权重,一般权重越高被返回的优先度也最高,匹配权重相关内容请参考官方文档attrs是配置文件中sql_attr_ 中的信息,稍后会提到这些属性的用法说了这么多,即使搜索到结果也不是我们想要的email数据,但事实sphinx是不记录真实数据的,所以要获取到真实email数据还要根据matches中的ID去搜索mysql的email表,但总体来说这样一来一回的速度还是远远比mysql的LIKE快得多,前提是几十万数据量以上,否则用sphinx只会更慢。接下来介绍sphinx一些类似mysql条件的用法
//emailid的范围
$sphinx-SetIdRange($min, $max);
//属性过滤,可过滤的属性必需在配置文件中设置sql_attr_ ,之前我们定义了这些
sql_attr_uint = fromid
sql_attr_uint
您可能关注的文档
最近下载
- 【备战25年高考数学】解答题07 6类新定义答题模板(解析版).docx VIP
- (完整)部编版五年级上册语文课堂作业本答案 .pdf VIP
- 化学-辽宁省名校联盟2024年高一10月份联合考试试题和答案.docx VIP
- 2025年国开(中央电大)行管专科《行政组织学》网上形考任务试题及答案_不确定精品.pdf VIP
- 消防救援队伍条令法规授课.pptx
- 2024 IMT-2030(6G)推进组白皮书 -6G分布式自治网络架构和关键技术研究.docx
- 2025年天津市专业技术人员公需考试试题-数字技术领域新职业——大数据应用驱动智能未来.docx VIP
- 广西北海市名校2024-2025学年高一上学期期中检测英语试题(含答案).docx VIP
- 自然地理学(伍光和)课后习题答案.doc VIP
- 食品工程原理试题思考题与习题及答案.doc VIP
文档评论(0)