- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
浅析搜索引擎算法的几个因素
搜索引擎算法是保密的,而且据说每天都在调整,具体没人知道。但是Ethan
认为搜索引擎算法源自两个方法论:程序推理和用户判断,程序推理分为两个维
度:相关性和重要性,用户判断分别为相关性和重要性乘上个系数。关键词相关
性由网页文本域内的关键词密度和分布决定。重要性也叫权重,一个网页的权重
由这个网页的血统和内容品质共同决定。由此,Ethan总结出搜索引擎算法的四
个方面:关键词相关性、网页血统、网页内容品质、用户判断,不妨称之为搜索
引擎算法的四大因素。大家从这四个方面思考,往往可以为被广泛认可的seo操
作找到理论依据,培养自己的seo 思维。有了seo 思维,才能突破教条式的操作
规定,在seo实战中灵活应变。
排名不是针对网站的,而是针对网页的。当用户搜索一个关键词时,搜索引
擎从以下四个方面分析被收录的页面,算出一个总分,总分最高的,排在自然排
名的第一位。
一、关键词相关性
网页文本域是Ethan创造的一个概念,想说明的意思是,搜索引擎在判断关
键词和网页之间的相关性的时候,不仅仅考察网页内的文字,还会考察网页外的
文字,主要包括反向链接锚文本的文字、反向链接页面的主题文字、域名的主题
文字,所有这些文字构成了这个网页的文本域。所谓主题文字,就是搜索引擎会
为每个域名和每个页面赋予一些文字,这些文字体现了这个域名或这个页面的主
题。大家都知道meta 标签里有keywords 和description,可以这样想象,搜索引
擎为页面增加了一些meta 标签,包括域名的主题文字、反向链接1的锚文本、反
向链接1所在页面的主题文字、反向链接1所在页面的域名的主题文字、反向链接
2的锚文本、反向链接2所在页面的主题文字、反向链接2所在页面的域名的主题
文字等等。这些meta 标签的权重要远高于keywords 和description,有的甚至高
于页面可见文字。有了网页文本域的概念,我们就能够理解外链建设等很多seo
操作。
注意搜索引擎会根据用户的搜索意图,把用户搜索的关键词翻译成内部实际
查询的关键词。多数情况下两者是一样的,但有的时候两者不一样。比如知道了
用户的ip 来自哪个地区,那么那个地区的相关页面会优先显示,有种用户搜索
时加进了地域性文字的效果。再比如近义词分析,搜索引擎会把近义词的搜索结
果也列出来。
关键词和一个网页的相关性由网页文本域内的关键词密度和分布决定,越相
关,排名越靠前。
二、网页血统
网页血统是Ethan 创造的一个概念,想说明的意思是,在搜索引擎看来,一
个网页天生就具备一种权重,这种权重来自url。搜索引擎会分析一个网页的url,
得到两种重要信息,第一是域名的情况,域名是有权重的,会直接传递到这个页
面;第二是反向链接的情况,每个反向链接所在页面也是有权重的,也会传递到
这个页面。我们经常遇到的pr 值,主要体现了通过反向链接传递的权重。
注意域名的权重不等于首页的权重,搜索引擎会根据首页的权重、网站整体
的情况(比如网站的稳定性和渐进性、站内是否有很多定向锚文本等等)、其它因
素(比如域名寿命等等)决定域名的权重。
一个网页的血统越好,权重越高,排名越靠前。
三、网页内容品质
在重要性方面,网页血统是传递性因素,单纯由外部传入;网页内容品质是
结构性因素,由这个网页自身相关的各种特质决定。这方面搜索引擎虽然不够智
能,但还是有很多手段的,其中最重要的是内容的原创性如何和内容的新鲜度如
何,特别是内容的原创性。还有比如网页中是否有定向锚文本和反向链接锚文本
是否定向,搜索引擎认为如果一个页面认真地写了定向锚文本或其反向链接锚文
本为定向的,说明这个网页内容品质较高。细节一些的,比如页面中有个图片会
更好一点,页面中适当使用list 标签会更好一 点,段落的开头适当出现“首先”、
“其次”这种词汇会更好一点,等等。
一个网页的内容品质越好,权重越高,排名越靠前。
四、用户判断
相关性和权重,数据源都不是来自用户的判断,搜索引擎很清楚,最重要的
是用户觉得好不好。虽然这方面获取数据源异常艰难,但搜索引擎还是有些办法
的,比如搜索跳出率,比如百度统计和google 分析,比如社会化网络的数据,
这是以后搜索引擎算法的发展方向,对排名的作用会越来越大。Ethan相信,搜
索引擎为了获取用户判断的数据源,会不惜血本。
本文由掏宝整理发布,
您可能关注的文档
- 数据库实验报告连兵超.doc
- 数据库的使用与文献检索方法.doc
- 数据库知识点.pdf
- 数据库知识点概要详细版.doc
- 数据挖掘_BERNARDKILLWORTHTECHNICAL(BERNARDKILLWORTH科技研究员互动情况数据集).pdf
- 数据挖掘及其在运输系统中的应用.pdf
- 数据挖掘在中学教学管理中的应用研究.pdf
- 数据挖掘在学习平台中的应用.pdf
- 数据挖掘在实际生活中的应用.doc
- 数据挖掘实验报告1.doc
- 难点详解鲁教版(五四制)6年级数学下册期末测试卷带答案详解(考试直接用).docx
- 难点详解鲁教版(五四制)6年级数学下册期末试题【培优】附答案详解.docx
- 难点解析鲁教版(五四制)7年级数学下册期末试题及完整答案详解(全国通用).docx
- 难点解析鲁教版(五四制)7年级数学下册期末试题含完整答案详解(名师系列).docx
- 难点解析鲁教版(五四制)7年级数学下册期末试题含完整答案详解【全国通用】.docx
- 难点解析鲁教版(五四制)7年级数学下册期末试卷(突破训练)附答案详解.docx
- 难点解析鲁教版(五四制)7年级数学下册期末试卷(能力提升)附答案详解.docx
- 难点详解京改版数学9年级上册期中试卷附参考答案详解【突破训练】.docx
- 难点解析鲁教版(五四制)7年级数学下册期末试题含完整答案详解(有一套).docx
- 难点解析鲁教版(五四制)7年级数学下册期末试卷带答案详解(夺分金卷).docx
最近下载
- 2025年中国抗CD20单株抗体项目创业计划书.docx
- 5.2《做自强不息的中国人》 课件-2024-2025学年统编版道德与法治七年级下册.pptx VIP
- 2025年初中地理中考跨学科专题练习附答案.docx VIP
- 天然气场站设备-题库.doc VIP
- 做自强不息的中国人 课件- 2024-2025学年统编版道德与法治七年级下册.pptx VIP
- 高速公路养护风险源辨识表.docx
- 2025年内蒙古时事政治考试试卷带解析AB卷.docx VIP
- 2025上海中学生时政大赛备考题复习试题附答案.doc
- 《GB 43500-2023安全管理体系要求》解读与培训.pptx
- 天然气场站设备拆除施工方案.doc
文档评论(0)