搜索引擎检索排序
发布日期:2023-04-18浏览量:169
用户输入关键词进行检索,百度搜索引擎在排序环节要做两方面的工作: 第把相干的网页从索引库中提掏出来;只知其一,不知其二,把提掏出来的网页根据差别维度的得分进行综合排序。
“差别维度” 包括:
(1) 相干性。网页内容与用户检索需要的婚配水平,如网页包罗的用户检查关键词的个数,以及这些关键词泛起的位置;外部网页指向该页面所用的锚文本等。
(2) 权威性。用户喜欢有必然权威性网站提供的内容,响应地,百度搜索引擎也更信赖优质权威站点提供的内容。
(3) 时效性。时效性后果指的是新泛起的网页,且网页内承载了奇怪的内容。今朝,时效性后果在搜索引擎中日益首要
(4) 首要性。网页内容与用户检查需要婚配的首要水平或受欢送水平。
(5) 丰硕度。丰硕度看似简略,倒是一个笼盖范畴十分广的命题,可以了解为网页内容丰硕,可以彻底知足用户需要;也能够了解为不只可以知足用户单一需要,还可以知足用户的延展需要。
(6) 受欢送水平,指该网页是否是受欢送
以上即是百度搜索引擎决议搜索后果排序时思索的六大准则。那末,六大准则的偏重点是如何的呢? 哪一个准则在理论应历时占比最大呢? 实在,在这里没有一个切当的谜底。在百度搜索引擎初期,这些阈值确实是相对于固定的,如“相干性" 在总体排序中的分量可以占到七成,但跟着互联网的不竭发展,检索手艺的前进,网站制作数目的暴发式增进,相干性曾经不是难题。于是,百度搜索引擎惹人了机械进修机制,让程序自动产出计较公式,推动排序战略愈加合理。
相关文章: