- 3
- 0
- 约4.39千字
- 约 5页
- 2017-08-23 发布于河南
- 举报
禁止搜索引擎收录的方法
什么是robots.txt文件?
搜索引擎使用spider程序自动访问互联网上的网页并获取网页信息。spider在访问一个网站时,会首先会检查该网站的根域下是否有一个叫做robots.txt的纯文本文件,这个文件用于指定spider在您网站上的抓取范围。您可以在您的网站中创建一个robots.txt,在文件中声明该网站中不想被搜索引擎收录的部分或者指定搜索引擎只收录特定的部分。
请注意,仅当您的网站包含不希望被搜索引擎收录的内容时,才需要使用robots.txt文件。如果您希望搜索引擎收录网站上所有内容,请勿建立robots.txt文件。
robots.txt文件放在哪里?
robots.txt文件应该放置在网站根目录下。举例来说,当spider访问一个网站(比如)时,首先会检查该网站中是否存在/robots.txt这个文件,如果Spider找到这个文件,它就会根据这个文件的内容,来确定它访问权限的范围。
网站 URL 相应的 robots.txt的 URL
/ /robots.txt
:80/ :80/robots.txt
:1234/ :1234/robots.txt
/ /robots.txt
我在robots.txt中设置了禁止百度收录我网站的内容,为何还出现在百度搜索结果中?
如果其他网站链接了您robots.txt文件中设置的禁
您可能关注的文档
最近下载
- 南京市2026届高三(二模)英语试卷(含答案详解).pdf
- 2024年北京市中考语文真题(解析版).pdf
- 2024年贵州贵阳初中学业水平考试地理试卷真题(含答案解析).docx VIP
- 2025届贵州贵阳初中学业水平考试地理生物试卷真题(含答案).docx VIP
- 2026年上海市闵行区高三二模英语卷(含答案).docx
- 企业数据分析师岗位招聘考试试卷及答案.doc VIP
- 数据分析师岗位专业测试.pdf VIP
- 2026届山东省济南市高三三模英语试题(含答案和音频).docx
- 人教版七年级音乐下册(简谱)第一单元《春游》教学教案.doc VIP
- 计算与人工智能概论(湖南大学信息科学与工程学院)学习通网课章节测试答案.docx VIP
原创力文档

文档评论(0)