搜索引擎大众都会用,百度,谷歌,搜狗,360这都是大众经常会用到的,咱们想搜什么它就给咱们呈现出什么,然则你晓得这些搜索引擎是怎么工作的吗?它们的工作原理是什么呢?咱们来听听谷歌工程师是怎么说的。
当咱们用Google进行搜索时,实质上搜索的并不是网页,而是在搜索Google的网页索引。是经过一名为“蜘蛛”的爬虫程序进行搜索的,“蜘蛛”先是抓取少量的网页,而后跟踪这些网页上的链接顺藤摸瓜,接着抓取这些链接指向的网页,再跟踪这些网页上的所有链接,并抓取它们链接到的网页,以此类推。直到几乎将所有的网页都编入到索引中,它存储了世界是所有电脑中的数百亿网页。
例如说我想晓得高铁的运行速度,我在搜索框内输入“高铁的运行速度”,点击搜索按钮后,就会在这些索引中搜索查询所有包括这些搜索字词的网页,而后系统会表示出包括关键词的成千上万条的结果。
Google怎样供给给咱们想要的确切答案呢?是经过关键字在网页显现的频率,还要看关键字是显现的标题还是内容或是网址,包含有无同义词等等一系列的要求层层筛选。还要思虑页面的PR值,PR值便是PageRank,意思是页面等级,PR值越高页面的权重就越高,重要性越高。
最后,搜索引擎会结合所有的原因为每一个网页评分,在咱们提交搜索后马上把搜索结果呈现出来。
以上便是谷歌的工程师讲解的谷歌平台的工作原理,虽然咱们平时用的更加多的是百度,搜狗、360这些搜索引擎,其工作原理都是同样的。
|