首页 >搜索营销

哪种排名算法最利于用户搜索查询

发布时间:2015-12-03     发布者:本地    

PageRank算法是对互联网的整体分析并计算,利用用户在网上的随机链接访问的模型计算每一个网页的PageRan 值,所以此方法与用户查询是分离的,满足用户对查询响应时间的要求。而HITS算法是站在互联网的局部角度进行演绎计算的,不同的根集由特定的查询所产生,接着计算网页的中心度和权威度,因此,它是由用户查询所决定的,响应时间要相对长一些。


虽然响应时间长,但是通过实验数据可以了解到,正是由于HITS算法与用户查询有关,所以HITS算法的排名准确性高于PageRank算法。搜索系统的相关性排序涉及到很多因素,其中,比较基础的排序模型来源于向量模型和布尔模型。


启动系统时,首先,布尔查询先执行,把返回的结果作为备选文档集,利用向量模型中的相似度算法计算查询词与各个文档相似度的值,得到的结果作为排序的依据,再结合其他排序的信息进一步计算。


比较典型的例子是,如果查询词出现在标题标签或者链接标签中时,就把计算好的PageRank值与文档的相似度权值通过线性组合相加方式得到最后的网页权重。


实现排序可以采用一种划分阶段的计算方法,分为三个阶段:检索关键词的临近关系计算结果;查询词在文档中出现的位置如何;相关度与其他的权重,如离线计算的网页 Pagerank 值,这些权值利用线性公式组合起来。Pagerank是目前许多数搜索引擎排序算法的基础,像百度和谷歌都是结合Pagerank和词频加权算法和超链接分析技术和用户的反馈信息来综合计算排序结果的。


上一篇:Alexa世界网站排名规则 下一篇:搜索引擎主题漂移现象详解

相关新闻