商道通企业营销问诊监理平台,帮您找到好专家!
企业网络营销服务
咨询热线: 18954161236

当前位置:首页  >  营销百科  >  营销通  >  搜索引擎的工作原理是什么_发展历程 附流程图

搜索引擎的工作原理是什么_发展历程 附流程图

投稿人:小商君 2016-11-03 16:28:00 3328

文章摘要: 搜索引擎的工作原理是什么?搜索引擎的基本工作原理包括如下三个过程:首先在互联网中发现、搜集网页信息;同时对信息进行提取和组织建立索引库;再由检索器根据用户输入的查询关键字,在索引库中快速检出文档,进行文档与查询的相关度评

  搜索引擎的工作原理是什么?

  搜索引擎的基本工作原理包括如下三个过程:首先在互联网中发现、搜集网页信息;同时对信息进行提取和组织建立索引库;再由检索器根据用户输入的查询关键字,在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并将查询结果返回给用户。

  1、抓取网页。每个独立的搜索引擎都有自己的网页抓取程序爬虫(spider)。爬虫Spider顺着网页中的超链接,从这个网站爬到另一个网站,通过超链接分析连续访问抓取更多网页。被抓取的网页被称之为网页快照。由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页。

  2、处理网页。搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引库和索引。其他还包括去除重复网页、分词(中文)、判断网页类型、分析超链接、计算网页的重要度/丰富度等。

  3、提供检索服务。用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页;为了用户便于判断,除了网页标题和URL外,还会提供一段来自网页的摘要以及其他信息。

  搜索引擎发展历程

  搜索引擎是伴随互联网的发展而产生和发展的,互联网已成为人们学习、工作和生活中不可缺少的平台,几乎每个人上网都会使用搜索引擎。 搜索引擎大致经历了四代的发展。

  1.第一代搜索引擎

  1994 年第一代真正基于互联网的搜索引擎 Lycos 诞生,它以人工分类目录为主,代表厂商是 Yahoo,特点是人工分类存放网站的各种目录,用户通过多种方式寻找网站,现在也还有这种方式存在。

  2.第二代搜索引擎

  随着网络应用技术的发展,用户开始希望对内容进行查找,出现了第二代搜索引擎,也就是利用关键字来查询。最具代表性、最成功的是 Google,它建立在网页链接分析技术的基础上,使用关键字对网页搜索,能够覆盖互联网的大量网页内容,该技术可以分析网页的重要性后,将重要的结果呈现给用户。

  3.第三代搜索引擎

  随着网络信息的迅速膨胀,用户希望能快速并且准确的查找到自己所要的信息,因此出现了第三代搜索引擎。相比前两代,第三代搜索引擎更加注重个性化、专业化、智能化,使用自动聚类、分类等人工智能技术,采用区域智能识别及内容分析技术,利用人工介入,实现技术和人工的完美结合,增强了搜索引擎的查询能力。 第三代搜索引擎的代表是 Google,它以宽广的信息覆盖率和优秀的搜索性能为发展搜索引擎的技术开创了崭新的局面。

  4.第四代搜索引擎

  随着信息多元化的快速发展,通用搜索引擎在目前的硬件条件下要得到互联网上比较全面的信息是不太可能的,这时,用户就需要数据全面、更新及时、分类细致的面向主题搜索引擎,这种搜索引擎采用特征提取和文本智能化等策略, 相比前三代搜索引擎更准确有效,被称为第四代搜索引擎.

  搜索引擎的工作原理图

搜索引擎的工作原理图

分享到:
©2012-2020 商道通在线(北京)科技有限公司 版权所有 京ICP备17039987号-1

京公网安备 11010502030885号

用户登录

Sign in
*
*
  忘记密码?
  如果您是新用户,请点击这里注册
 

友情提示

您的余额不足,请到充值中心充值或选择其他版本

立即充值