Maoseomao:深入了解搜索引擎原理第二课
上节回顾上一节maoseomao主要讲解了google搜索引擎更新爬虫,和深度爬虫。
更新爬虫:Google搜索引擎可以同时派出N个爬虫,同时访问互联网,如果发现新的信息就会放到自己所带的数据库中,我们把这种爬虫称之为更新爬虫。更新爬虫能够根据互联网上的URL地址,不停的以光速爬行,一旦自己所带的数据库装不下更多的信息时,它们会返回谷歌所提供的单独数据库,把自己所带的信息放在里面,然后又出来接着收集信息。
深度爬虫:深度爬虫的主要任务是访问google主索引中已经存在的网站,进行整体的服务器更新,目前google深度爬虫几乎可以每天更新一次,所以如果不注意观察是根本察觉不到的。但是百度深度爬虫的时间就要长一点,大概是一周进行深度爬行一次,所以许多做百度的seo,都盼望百度深度爬行,因为百度深度爬行,就意味着,自己上一周的工作将被百度肯定。
今日重点
这一节maoseomao将讲解google搜索引擎的具体工作流程,以及如何为我们提供搜索结果。
【以上是笔者经过查看资料,画出的谷歌工作流程图,画的不是很好,希望大家谅解】
第一步:google服务器整理,google每天派出大量更新爬虫,到互联网发现新的网站信息,然后带回google服务器等待进行整理。
第二步:Google服务器进行整理后,索引到google主索引中去,将没有被索引的信息进行删除。
第三步:Google服务器整理,每天放出google深度爬虫,爬行主索引,对资料采用关键词排名算法进行计算,列出名次,数据库稳定。
第四步:用户输入主关键词时,GG服务器,将用户输入转换为计算机看的懂的内容,并向主索引索取答案。注意:GG服务器向主索引索取的答案是由:GG主索引内容+更新爬虫内容 一起组成的。
第五步:主索引将关键词列表转换成字符流,交给GG服务器,GG服务器,再将答案显示给用户。
Google何时开始为您打分
以上便是google整个工作流程,对此工作流程比较有争议的是:google何时开始给您的网站关于某个关键词打分。
据笔者观察,google是在爬行您的网站,收集网站信息时就开始记录您网站表现,关于网站的结构是否友好,网站链接相关度是否足够高,网页代码是否友好.......等这些排名因素。等到google服务器放出深度爬虫时,主索引根据排名算法进行排名时,更新爬虫会把自己的数据也递交给主索引,帮助排名算法进行工作。
Google提供的搜索结果
对于许多seo来说,google只有一种搜索结果--内容关键词结果。其实google提供的关键词搜索结果还有一种特殊结果--图片,pdt文件等。笔者建议各位seo适当的关注特殊搜索结果。
要知道在未来,并不是单单内容搜索才能获得客户。
下期预览
今天google搜索引擎工作流程就说到这里,明天内容--搜索引擎排名原理,关注Page Rank(pr),以及我们如何正视这个排名神话。
本文由陕西基石广告有限公司原创版权所有
页:
[1]