- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
不得不说正则是个十分强大的功能,有了他,让我们处理一些复杂的字符变的得心应手。其实所谓的程序无非都是对字符的处理,我之前也提到过,无非都是对字符的操作,所以,会了正则,会让你在做程序开发时多了一条很便捷的途径。这里我其实也用到了用正则匹配文章中的url,进行提取域名。
因为有很多网站的文章都是拷贝的各个其他网站上的,所以有的时候里面会有一些导出链接,可能会影响网站的权重,所以,我们要对发布的文章进行一下过滤。我在这里以织梦的文章发布为例来做的。因为有些链接也是不能过滤的,比如一些自己网站的链接,或一些自己必要的外部链接。所以,我们用正则匹配文章中的url,然后提取出域名,根据域名判断是否要替换,我们可以将外部链接的链接去掉,也就是将a标签去掉。而只留下之间的部分就可以了。下面看一下代码。
//过滤文章中除指定域名之外的链接
$pre = |a[^]*?\s*href=\\\http://(?:.*?)\.(.*?)\.(?:.*?)/(?:.*?)\(?:.*?)(.*?)\/a|i;
preg_match_all($pre,$body,$a);
if($a){
$qian = $a[0];
$home = $a[1];
$hou = $a[2];
foreach ($home as $key=$val){
if($val==beelink||$val==zoosnet){
continue;
}else{
$body = str_replace($qian[$key],$hou[$key],$body);
}
}
}
将这段代码加到织梦的文章发布处理文件article_add.php的$body = AnalyseHtmlBody($body,$description,$litpic,$keywords,’htmltext’);提取摘要之前就可以了。这里面用到了正则的断言。来屏蔽了一些不必要的匹配。这个正则匹配出来三部分,第一部分是整个链接,第二部分是域名,第三部分是去掉a标签后的部分。所以我们遍历第二部分,是指定的可以发布的域名就结束本次循环,如果不是,就将对应的第一部分替换为对应的第三部分。替换因为不是复杂的匹配,所以用php自带的替换就可以了,正则虽然很方便,但是他比较耗费资源,如果可以,尽量使用php自带的函数来操作。这样就可以实现将一些外部链接替换掉了!
网站地图
您可能关注的文档
最近下载
- 盐酸氨溴索欧洲药典EP11.6英国药典BP2024译文及原文.pdf VIP
- 房建工程监理投标方案.doc VIP
- 2025年五年级英语上册 期中测试卷 沪教牛津版.pdf VIP
- 2025年山西水利职业技术学院单招职业适应性测试题库及参考答案.docx VIP
- 《体育与健康》课程标准考试试题(含答案) .pdf VIP
- 2025年山西水利职业技术学院单招职业适应性测试题库及答案一套.docx VIP
- 2026年全球美容与个人护理趋势预测报告-.pptx VIP
- 抗战时期北海币发行量与物价波动关系研究.docx VIP
- 2025年山西水利职业技术学院单招职业适应性测试题库最新.docx VIP
- 福建科宏生物工程股份有限公司三氯蔗糖技改扩建项目环境-永安.PDF
原创力文档


文档评论(0)