资讯专栏INFORMATION COLUMN

搜索引擎的工作原理是什么

Tecode / 2015人阅读

摘要:互联网信息爆发式增长时代,要想做好就必须简单了解搜索引擎基本工作原理以及自然排名机制搜索引擎工作过程是非常复杂,冬镜在本章介绍的内容相对于真正的搜索引擎技术来说仅仅是皮毛不过对新手已经足够用了,我尽量以最容易理解的方式来讲解一搜索引擎蜘蛛搜

互联网信息爆发式增长时代,要想做好SEO就必须简单了解搜索引擎基本工作原理以及自然排名机制

搜索引擎工作过程是非常复杂,冬镜SEO在本章介绍的内容相对于真正的搜索引擎技术来说仅仅是皮毛

不过对新手SEO已经足够用了,我尽量以最容易理解的方式来讲解

一、搜索引擎蜘蛛

搜索引擎工作原理

搜索引擎蜘蛛又称网页爬虫。目的:抓取高质量的网页内容。下面讲几个常见的搜索引擎蜘蛛分类:

1.1 Baiduspider(百度蜘蛛)

百度公司还有其它几个蜘蛛:Baiduspider-news(新闻)、Baiduspider-mobile(wap)、Baiduspider-image(图片)、Baiduspider-video(视频),站长经常见到的是Baiduspider和Baiduspider-image

1.2 Googlebot(谷歌蜘蛛)

还发现一个Googlebot-Mobile,看名字应该是抓取wap内容的

1.3 360Spider(360蜘蛛)

它是一个很“勤奋抓爬”的蜘蛛

1.4 Sogou News Spider(搜狗蜘蛛)

还包括如下这些:Sogou web spider、Sogou inst spider、Sogou spider2、Sogou blog、Sogou News Spider、Sogou Orion spider,看最权威的百度的robots.txt http://www.baidu.com/robots.txt 就为Sogou搜狗蜘蛛费了不少字节,占了一大块领地。
其它还有很多蜘蛛就不过多介绍,SEO优化主要针对这四个就可以,有兴趣可阅读搜索引擎蜘蛛大全这篇文章

二、搜索引擎的工作原理
搜索引擎工作原理
重庆SEO认为搜索引擎的工作原理大致上可以分成3个阶段:

1.爬行和抓取

2.预处理(建立索引)

3.输出结果

2.1 爬行和抓取

搜索引擎蜘蛛通过链接发现链接的方式去访问网页,从而获得页面HTML代码存入数据库

那么搜索引擎蜘蛛又是怎样抓取网页的呢?

答:发现某一个链接 → 下载这一个网页 → 加入到临时库 → 提取网页中的链接 → 在下载网页 → 循环
2.2 预处理(建立索引)

蜘蛛(专业术语:索引程序)对抓取来的网页内容要进行关键词提取、生成倒排索引、页面PageRank值及TrustRank值计算、页面关键词相关性等处理以备排名程序调用,这也是搜索引擎能在极短时间内返回搜索结果的关键,其中我们最关心的是PR值和相关性

2.3 输出结果

用户输入关键词后,排名程序调用索引库数据,程序自动匹配关键词,然后按一定规则生成搜索结果展示页面,这是因为前面的预处理,搜索引擎才能够在很短的时间内返回输出结果,这里特别要提醒一下自然搜索排名和竞价推广排名是有区别的

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/126402.html

相关文章

  • JavaScript 工作原理之一-引擎,运行时,调用堆栈(译)

    摘要:本章会对语言引擎,运行时,调用栈做一个概述。调用栈只是一个单线程的编程语言,这意味着它只有一个调用栈。查看如下代码当引擎开始执行这段代码的时候,调用栈会被清空。之后,产生如下步骤调用栈中的每个入口被称为堆栈结构。 原文请查阅这里,本文采用知识共享署名 4.0 国际许可协议共享,BY Troland。 本系列持续更新中,Github 地址请查阅这里。 这是 JavaScript 工作原...

    Betta 评论0 收藏0
  • JavaScript 工作原理之一-引擎,运行时,调用堆栈(译)

    摘要:本章会对语言引擎,运行时,调用栈做一个概述。调用栈只是一个单线程的编程语言,这意味着它只有一个调用栈。查看如下代码当引擎开始执行这段代码的时候,调用栈会被清空。之后,产生如下步骤调用栈中的每个入口被称为堆栈结构。 原文请查阅这里,本文采用知识共享署名 4.0 国际许可协议共享,BY Troland。 本系列持续更新中,Github 地址请查阅这里。 这是 JavaScript 工作原...

    Alex 评论0 收藏0
  • [译文] JavaScript工作原理引擎、运行时、调用栈概述

    摘要:调用栈是单线程编程语言,意味着它只有单一的调用栈。调用栈是一种数据结构,基本记录了程序运行的位置。举个例子,先来看如下所示的代码当引擎开始执行这段代码时,调用栈将是空的。这正是抛出异常时栈追踪的构造过程这基本上就是异常抛出时调用栈的状态。 原文 How JavaScript works: an overview of the engine, the runtime, and the c...

    PAMPANG 评论0 收藏0
  • javasctipt 工作原理之调用栈

    摘要:译者注翻译一个对新手比较友好的工作原理解析系列文章注意以下全部是概念经验丰富的老鸟可以离场啦正文从这里开始随着的流行团队们正在利用来支持多个级别的技术栈包括前端后端混合开发嵌入式设备以及更多这篇文章旨在成为深入挖掘和实际上他是怎么工作的系列 译者注 翻译一个对新手比较友好的 JavaScript 工作原理解析系列文章 注意: 以下全部是概念,经验丰富的老鸟可以离场啦 正文从这里开始 随...

    Pines_Cheng 评论0 收藏0
  • 【最全】Java 进阶面试总结

    摘要:这里有一份面试题相关总结,涉及高并发分布式高可用相关知识点,在此分享给大家,希望大家能拿到一份理想的知识点会陆续更新在上,觉得还算凑和的话可以关注一下噢高并发架构消息队列为什么使用消息队列消息队列有什么优点和缺点都有什么优点和缺点如何保证消 这里有一份面试题相关总结,涉及高并发、分布式、高可用相关知识点,在此分享给大家,希望大家能拿到一份理想的 Offer! 知识点会陆续更新在 Git...

    nifhlheimr 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<