郑州天伦医院Seo关健词分析教程.ppt

  1. 1、本文档共26页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
搜索引擎蜘蛛和网页的三大问题 一、搜索引擎蜘蛛能不能找到你的网页 二、搜索引擎蜘蛛找到网页后能不能抓 取网页 三、搜索引擎蜘蛛抓取网页之后,能不 能提炼有用信息 一、搜索引擎蜘蛛能不能找到你的网页 1搜索引擎喜欢什么样的网站 ⑴网站内容的相关性 ⑵网站及网页的权威性 ⑶网站的实用性 2搜索引擎蜘蛛算法与蜘蛛程序构架 ⑴网络蜘蛛基本原理 ⑵网站与网络蜘蛛 ⑶网络蜘蛛对内容提取 ⑷网络蜘蛛的程序构架 想把网站搜索排名提高,就得研究搜索引擎喜欢什么样的网站, 也就是用户搜索的关键词与网页内容是否匹配,是否有相关性。 相关性的加强可以通过页面内优化和一小部份链接优化来达到的,包括页面的关分健词位置布局、关健词的强调、通过语义分析得到相关性、内部链接的安排、网页标题等。外部链接锚文字,以及链接的内容,也会对目标网页的相关性产生影响。 内容相关性是做网站的人最容易控制的,也是最容易被作弊的。第一代的搜索引擎就主要以相关性做判断,但在被钻空子钻的一塌糊涂后,不得不引入权威性的衡量。 网站的权威性,大部份是由外链所决定的。高质量的外链越多,网站的权威性就越高。另外,域名的注册历史,网站的稳定性,隐私政策等一些细节,也会影响到权威性。 外链对网站的权威性是有选择性的,也就是说,来自相关内容网站的链接对提高链权威性帮助最大。比如,在医院博客上加一个链接到某个钢材网站,很明显,医院在钢材方面没有权威性。 网站的权威性不能被做网站的人完全控制,想要作弊,比较费时费力,群发等手段还容易被查出来,但是如果花钱花时间,还是可以得到人为的外链,所以现在搜索引擎开始考虑网站的实用性。 即对用户来说,你的网站到底有多大用处?用户是不是喜欢你的网站? 如果用户在你的网站花的时间多,游览页数多,在不同的时间经常来看你的网站,加入了游览器书签,并且在不同的网上书签站加了评论,这些都可以帮助搜索引擎理解你的网站对用户的实用性。 搜索引擎的工具条可以帮助收集这类信息,也可以利用社会网络收集信息。     搜索引擎建立网页索引,处理的对象是文本文件。对于网络蜘蛛来说,抓取下来网页包括各种格式. 包括html、图片、doc、pdf、多媒体、动态网页及其它格式等。 这些文件抓取下来后,需要把这些文件中的文本信息提取出来。准确提取这些文档的信息,一方面对搜索引擎的搜索准确性有重要作用,另一方面对于网络蜘蛛正确跟踪其它链接有一定影响。 ? 对于doc、pdf等文档,这种由专业厂商提供的软件生成的文档,厂商都会提供相应的文本提取接口 因为现在的主流网站大多采用的是HTML语言写的,这里大概说一下HTML。 HTML有一套自己的语法,通过不同的命令标识符来表示不同的字体、颜色、位置等版式,如:、、等,提取文本信息时需要把这些标识符都过滤掉。过滤标识符并非难事,因为这些标识符都有一定的规则,只要按照不同的标识符取得相应的信息即可。 但在识别这些信息的时候,需要同步记录许多版式信息,例如文字的字体大小、是否是标题、是否是加粗显示、是否是页面的关键词等,这些信息有助于计算单词在网页中的重要程度。 同时,对于HTML网页来说,除了标题和正文以外,会有许多广告链接以及公共的频道链接,这些链接和文本正文一点关系也没有,在提取网页内容的时候,也需要过滤这些无用的链接。 例如某个网站有“医院介绍”频道,因为导航条在网站内每个网页都有,若不过滤导航条链接,在搜索“产品介绍”的时候,则网站内每个网页都会搜索到,无疑会带来大量垃圾信息。 那么如何用ASP构建网络蜘蛛呢?答案是:Internet transfer control (ITC信息转移控制)。这个由 微软提供的控件,将使你能够通过ASP程序访问Internet资源。你可以用ITC搜寻Web页面,访问FTP服务器,甚 至可以发送邮件标题。   有几个缺陷必须先说明一下。第一,ASP无权访问Windows的注册表,这就使某些ITC正常存储的常量和数 值不可用。通常你可以通过设置ITC为“不使用默认值”来解决这个问题,这就需要你在运行过程中指明每一 次的值。 ? 另一个更严重的问题是关于许可证书的。由于ASP不具备调用License Manager(一项Windows中的功 能,可以保证组件和控件的合法使用)的功能,那么当

文档评论(0)

celkhn5460 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档