《1.1.3、搜索引擎工作原理--预处理基础简介》中介绍了搜索引擎会为每个网页进行预处理,以最好的结构保存在数据库中,为三段式工作流程中的查询服务打下基础,那么在本节就介绍一下搜索引擎查询服务的基础简介。

查询服务主要工作

查询服务是搜索引擎和用户离得最近的一个模块。在这个模块中主要完成了以下3个工作:

1、查询匹配

搜索引擎会将用户输入的语句进行分词,并且提取出有意义的查询关键词,然后返回网页中包含有这些关键词的网页。

例如下图,虽然用户查询的是“搜索引擎的原理”,但是搜索引擎会对这个查询进行分词,分成“搜索引擎”、“的”、“原理”三个词,然后删除没有意义的“的”,接着找出和“搜索引擎”、“原理”匹配的网页进行组合生成结果页面。

查询匹配

2、结果排序

预处理中为每个网页形成了一个独立于查询词的重要性指标,将这个指标和查询过程中的相关性指标结合形成最终排序结果,是搜索引擎给出查询排序结果的主要方法。

结果排序

3、文档摘要

一般的搜索引擎采用“动态摘要”的方式生成摘要,即在相应查询的时候根据查询词在文档中的位置,提取出周围的文字,在显示时将查询词标亮

文档摘要

小结

以上就是搜索引擎查询服务的简介,不难看出查询服务还需要一些细节的支持,例如中文自动摘要搜索结果页的生成等等技术。之后黄聪会和大家一起探讨这些细节。

下一节我们了解一下《1.1.5、搜索引擎工作原理--体系结构》