为什么搜索引擎喜欢Blog..ppt

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
为什么搜索引擎喜欢Blog /blog/ 车东 搜索引擎做为互联网的“路由器” 搜索引擎是网民的上网主要入口之一; 搜索引擎每天给其他网站带去4-6亿流量(相当于搜索引擎自身流量的1-2倍); 在内容网站的外网来源流量中: 搜索引擎占80%-90%; 超过传统的友情链接等推介方式一个数量级以上; 从搜索获益最多网站之一维基百科 维基百科每天从Google获得数百万用户流量; 内容管理系统(CMS)比较 同样是:标题,时间,作者,内容这几个因素的组合,为什么blog/wiki/新闻组归档往往比BBS更容易被搜索引擎搜到? 为什么同样的内容:大网站的转载往往比原文出处排名更靠前? 什么样的网站对蜘蛛比较友好?(Spider Friendly) 比较成功的几个Blog发布系统: 几年前第一次找Blog发布系统: WordPress (php) 便于架设,插件丰富,管理简单 MovableType(活字印刷的系统) 性能较好; 比较流行的BSP发布商: LiveJournal; Blogger; 这些Blog发布系统的特点 链接稳定; 蜘蛛抓取方便; 按时间归档; RSS输出; Trackback ping/留言反馈机制; 分类归档; 搜索引擎的职能: 重现 点击搜索结果链接地址,却无法返回期望的结果,用户会很失望; 服务器无法访问; 页面不存在; 内容已经变更; 搜索引擎的重要职能:重现 Blog内容: 单条目永久链接: PermaLink 每个条目都是永久链接 个人按月归档: 条目数量仍然控制在几十条之内,不用分页; 按类目归档: 即使有内容更新,旧内容仍然保留 BBS/论坛的内容: 由于内容量过多,旧内容往往会被删除; index.php?page=12 这样的链接几天后内容全部变化; &PHPSESSION=l85skdj23w4qq2sw3w42 每个蜘蛛识别为不同链接; 网页快照可以解决一部分问题 但是用户得到的内容可能是过时的; 原网站丢失了原本可以获得的用户; 搜索引擎的负担:除重 Blog内容: 内容页相对稳定; 归档链接规则稳定; 类似的:邮件列表归档也是搜索引擎比较容易收录的内容; BBS内容: Foo.php?a=1&b=2 与 foo.php?b=2&a=1 内容是一样的 index.html?from=foo 与index.html?from=bar内容是一样的 不同地址标记相同内容的危害 会损失其他地址带来的链接; 大量使用转向进行统计也为搜索引擎识别链接的别名带来负担; 访问日志中的referer可以代替标记跟踪来源; 帧结构: frame不利于蜘蛛抓取 BLOG大部分为平板式页面浏览; BBS的左导航/右侧内容模式,不利于蜘蛛抓取,也不利于重现; 性能因素:缓存机制 静态归档更容易缓存性能更高 MT的静态页面归档; LJ的memcache动态缓存模式; 动态页面生成: 过大压力下容易造成服务器宕机; 结构化数据库往往是瓶颈; Tips:Cache Friendly ~= SEO 使用稳定的连接:避免经常变化; 避免使用动态参数来进行点击来源跟踪 index.html?source=foo Index.html?source=bar 有更简单的方法:基于referer进行来源识别; 增加Last-Modify/Expires等缓存控制Header; 链接/域名更换: 要保留原地址可访问, 设置301转向; Blog内容的特点 作者对内容/回复完全控制; 个人版权声明: CC; 时效性; 归档机制; 主贴和回复是天生不平等的 文章发布者是文章条目的所有人; 可以控制回复的数量和质量、排序等因素; 可以控制文章; 主贴作者甚至无法控制低质量的回复; 回复内容展现大量的噪音: 回复者的信息,排名,签名等噪音 回复和主贴存储在同一空间中,严重降低效率; 私有内容:利于内容长期维护 Blog内容是私有的; 面向归档,备忘的; 内容可重用度较高; 是个人的在线虚拟资产; 原创内容相对多; 不同搜索引擎对于新发现内容有一定的加权,一般2周后,或者1个月后内容会回到同其他内容一样的权重; BBS内容则无法承诺长期保存; 内容实效性较强; 缺乏搜索引擎来源的反馈,影响面有限; 转载多,原创少; 引用发现和用户交互 可视化编辑器在blog发布系统中广泛使用: 内容来源链接地址:内部/外部都较多; BBS为防止XSS,往往禁用可视化编辑器或使用BBCODE; 如何方便转载者主动标记原文出处: 再次推销一下[chedong copyright模板] 便于用户Copy/Paster并能有效链接的模板 为用户做正确的事情提供方便; RSS: 低成本新内容发现机制 节省带宽: 不遍历网站内容而发现最新内容;

文档评论(0)

5201314118 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:7065201001000004

1亿VIP精品文档

相关文档