站内搜索数据提交流程及格式说明.doc.docVIP

站内搜索数据提交流程及格式说明.doc.doc

  1. 1、本文档共17页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
站内搜索数据提交流程及格式说明.doc

站内搜索数据提交流程和格式说明 一、站内搜索数据提交流程 1、按照“百度站内搜索数据提交模板_0”格式要求组织好XML格式的数据文件,每个文件最多可包含 50,000 个网址,并且应该小于 10MB(10,485,759字节);或者,创建包含上述数据文件地址的sitemap索引文件,每个索引文件包含的XML格式数据文件个数不限,但是单个索引文件应该小于10MB(10,485,759字节)。 2、将数据文件或sitemap索引文件放到网站服务器上(建议放置在根目录下)。 3、进入站内搜索工具的“提交数据”页面,点击“添加新数据”按钮;在新页面内依次选择文件类型(当前只有一个文件类型且已经默认选中),填写数据文件更新周期,填写数据文件(或sitemap索引文件)地址,输入验证码后,点击“提交”,则返回结果列表页;此时列表中新增1条或多条数据文件(或sitemap索引文件)地址。 若点击“取消”将不保存设置并直接返回列表页。 4、在百度开始处理您的数据之前(通常提交后1小时内开始处理),列表第3列将显示“等待”状态;如果数据不符合格式规范,状态将显示为“错误”,您可以根据提示修正数据后重新提交;如果所有数据通过格式校验,则状态为“正常”,但并不表示所有数据已经被抓取,抓取的快慢和您提交的数据量有关。 5、数据文件提交后,百度会自动开始抓取url,默认设置是10url/s(一天86万)。一般情况下第二天下午14:00之后可基于已抓取url提供搜索服务。当网站url数量较多的时候,需要等待若干天才能提供全部url的搜索。 6、更多有关数据提交的问题可查看 HYPERLINK /search/sitemap_faq.html Sitemap协议常见问题解答和 HYPERLINK /search/sitemap_opfaq.html 操作常见问题解答。 二、站内搜索数据格式说明 数据格式基本信息 数据格式中文名:百度站内搜索数据提交模板_0数据协议类型:sitemap协议标签顺序:站长不可乱序提供标签字符编码:仅支持UTF-8其他限制:标签/属性大小写敏感,且url类型不支持中文字符百度站内搜索数据格式遵守“ HYPERLINK /search/sitemap_help.html \l 05 百度sitemap协议”,是基于XML格式的扩展版本,在urlset、url、loc、lastmod、changefreq、priority6个固定标签基础上,新增2个固定标签和16个扩展标签,便于站长组织并提交各个维度的有价值信息,用于搜索结果的摘要展现或筛选、排序。 注意: 1、扩展标签中的title和pubTime虽然不是“必填”,但是建议填写。 title将被站内搜索结果优先用作标题,可以避免展现站点名这类冗余信息。不会影响百度大搜索中的标题展现。 pubTime即内容发布时间,是按照时间筛选或排序的主要依据。 2、建议有条件的站点将正文内容通过content提交过来,这对于减轻百度对站点服务器的访问压力、提升收录效率都有较大帮助。content内容将被用来生成摘要,计算相关性,因此务请保证content内容的完整性。同样,只影响站内搜索,不会影响百度大搜索。 3、其他扩展标签及其属性,可以根据需要选填。 数据格式具体说明 (1)xml固定标签 标签名称 标签用途 标签类型 标签限制 可选/必选 urlset 标记整个文档的开始和结束/ /必选 url 标记每条信息的开始和结束 / 1个urlset可以包含很多url必选 loc 该条数据的存放地址 url 以http://开头 最大长度256个字符必选 lastmod 该条数据的最新一次更新时间 日期 时间格式为yyyy-mm-dd可选 changefreq 该条数据的更新频率 字符串 有效值为:always、hourly、daily、weekly、monthly、yearly、never可选 priority 指定此链接相对于其他链接的优先权比值小数 数值范围:0.0~1.0可选 data标记扩展数据的开始和结束//必选display标记扩展数据中用作展现的字段的开始和结束/“展现”具体包括摘要展现、筛选选项展现、排序选项展现等;“非展现”指排序策略等用途必选(2)xml扩展标签(所有标签为选填项) 说明:“可筛选”“可排序”指的是相应字段或属性在搜索结果页外观设置中的作用;因为所有字段都可用于展现,所以未单独标注。具体应用方式可参考 HYPERLINK /wiki/110 Custom Search帮助文档。 标签名称属性标签

文档评论(0)

ktj823 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档