- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
SEO中找到你的服务器日志
我是一个巨大的波特兰开拓者队的球迷,并在21世纪初,我最喜欢的球员是拉希德 - 华莱士。他是一个避雷针的球员和球迷,无论是爱或恨他。他领导的联盟的技术犯规,几乎每一年,他是一个开拓者,主要是因为他从来没有想过他犯了什么样的犯规。许多人表示,技术面来了,当对方球员错过了一个罚球尝试,“希德”热情尖叫着他的口头禅:“球是不会说谎的。”
“希德”称,篮球形而上学的权力,作为一个完整的游戏系统的监督和制衡,。虽然这是值得商榷的(好吧,可能并非如此),有一个平行的SEO技术:市场营销人员和开发人员经常犯构建一个网站的SEO犯规时或创建内容,但含蓄地否认,什么是错的。?
?
作为SEO的,我们使用的工具来收集各种技术问题,可能会伤害我们:网络分析,抓取诊断,谷歌和Bing网站管理员工具的洞察。所有这些工具是有用的,但也有无疑在数据中的孔。只有一个真正的搜索引擎,如Googlebot记录,处理您的网站。这是网络服务器日志。我敢肯定,拉希德 - 华莱士同意,日志是一个强大的经常未得到充分利用的数据来源,有助于保持您的网站的抓取,搜索引擎在检查的完整性。?
?
?
服务器日志中的每一个动作由一个特定的服务器进行了详细的记录。在一个Web服务器的情况下,你可以得到很多有用的信息。事实上,早在一天前免费分析工具(如谷歌Analytics(分析))存在,这是常见的分析和检查您的网络日志软件,如AWStats的。?
?
我最初打算写关于这个问题的一个职位,但我得到了,我意识到,有很多的地面覆盖。相反,我将它分解成2个部分,每个部分突出不同的问题,可以发现在你的Web服务器日志:
?
这篇文章:如何检索和分析的日志文件,并根据您的服务器的响应代码(404,302,500等)的识别问题。
下一篇文章:识别重复的内容,鼓励高效的爬行,审查趋势,寻找模式和一些奖金非SEO相关的提示。?
第1步:获取一个日志文件
Web服务器日志是在许多不同的格式,和检索方法取决于你的网站上运行的服务器的类型。Apache和微软的IIS是最常见的。在这篇文章中的例子,从的Apache日志文件的基础上。?
?
一个系统管理员,如果你在一家公司工作,是非常好的,问他/她一天的有价值的数据和字段下面列出的一个日志文件。我建议你??保持一演出下面的文件大小的日志文件解析器,你可能会阻塞。如果你有自己的生成文件,这样做的方法取决于你的网站托管。一些托管服务,并将它们存储在你的home目录中的一个文件夹,名为/日志,会掉落一个压缩日志文件,该文件夹中,每天的基础。你会想,以确保它包含下面几列:
?
主持人:你将使用它来过滤掉内部交通。RogerBot在SEOmoz的情况下,花费了大量的时间抓取的网站和我们的分析需要删除。?
日期:如果您要分析多天,这将允许您分析搜索引擎的抓取率的趋势。?
页面/文件:这将告诉你哪些目录和文件进行爬网,可以帮助查明特有的问题,在某些路段或类型的内容。
响应代码:服务器知道响应的服务器 - 在页面加载罚款(200),(404),(503) - 提供了宝贵的洞察效率低下的抓取工具可能会运行到。
从哪里来:用于分析搜索机器人,而这不一定是有用的,它是非常有价值的为其他流量分析。
用户代理:此栏位会告诉你的搜索引擎提出的要求,如果没有这个字段,爬行,无法进行分析。
Apache日志文件默认情况下是没有用户代理或引荐返回 - 这被称为一个“共同的日志文件。”,您将需要申请“合并日志文件让您的系统管理员的工作变得更容易一些(甚至留下深刻的印象。” ),并请求的格式如下:
?
的LogFormat“%H%L%U%T \”%r \“% s%B \”%{Referer的}?? \“\”%{用户代理} \“”
?
对于Apache 1.3,你只需要“组合拳CustomLog日志/访问日志”
?
对于那些需要手动拉的日志,您将需要创建一个与上述指令在httpd.conf文件中。很多更详细的?关于这个问题的。 ?
?
第2步:分析日志文件
您现在可能已经有一个压缩的的日志文件像“mylogfile.gz”和它的时间开始挖。有无数的软件产品,免费和付费,分析和/或分析日志文件。我选择其中的一个主要标准包括:能够查看原始数据,过滤能力来分析,和导出到CSV的能力。我降落在Web日志管理器(/WebLogExplorer/),它为我工作了好几年。我将用它与Excel此演示。我已经使用awstats的基本分析,但发现它并没有提供,我需要的控制和灵活性水平。我敢肯定,有几个在那里,将完成这项工作。?
?
第一步是导入文件到您的分析软件。大多数的网页的日志解析器将接受各??种格式,有一个简单的向导,引导你通过进口。分析的第一阶段中,我最喜欢看所有的数据和不应用任何过
文档评论(0)