《1.1.5、搜索引擎工作原理--体系结构》中我们知道搜索引擎除了三段式工作流程的网页搜集、预处理、查询服务以外,还有一个独立的模块,那就是用户行为分析模块。

其中,用户行为分析模块主要分析的是用户查询日志以及用户点击日志,这些日志都是存放在用户行为数据库中的。

为什么需要用户查询与点击日志?

在用户利用搜索引擎进行搜索的时候,搜索引擎会在日志中记录用户到达搜索引擎的时间、来源网站,以及用户IP地址、首选的搜索引擎产品,输入的查询词、查询词是直接输入还是从推荐的查询词中选取的,对返回的结果点击了哪个结果等。

得到了这些日志,对于搜索引擎有如下意义:

  • 1、查询词提示。
  • 2、命名实体类别识别。
  • 3、查询结果评估。
  • 4、优化查询结果排序。
  • 5、…

小结

用户行为分析在搜索引擎业界越来越受到重视,因为搜索引擎越来越重视客户体验,用户体验好的网页将能帮助搜索引擎吸引到更多的用户,因此我们也要与时俱进,一同分析用户行为。下一节黄聪就来和大家一起研究《5.2、用户行为分析--查询日志分析》