试题详情
简答题写出你所知道的搜索引擎的常用算法(至少两种)?
  • 这个确定不专业简单知道点。
    1.词频位置加权排序算法:顾名思义是说从整个网站上的文字的位置上与出现的次数进行排序,先来说一下位置,不同的网站关键词在内容里出现与在标题里面出现时差别非常大的,搜索引擎认为标题能表现出一个网站是干什么的,如果标题里面出现了关键词要远比文章里面出现关键词重要的多的多。这就是现在大家都知道一个网站的标题是非常重要就是从这个算法里演化出来的。再说一下出现的次数,一个词在一个网站里或某一个页面里出现的次数越多说明它的相关性就越强,这一说法是卢恩最先提出来的自动标引的方法,也是大家所说的关键词密度也是从这个算法里面演变出来的。词频位置加权排序算法的局限性在于只注重词在网站的表现而去给某个网站的排名,这算法是最初搜索引擎所主要使用的,那时候站长在网站上标题里内容里还有什么Keywords甚至图片alt里使劲堆砌关键词,堆的越多排名就越好。
    2.Directhit算法:这个算法是根据用户行为来给网站进行排序,具体的是搜索引擎在用户搜索某个词的时候,会记录他的点击某个网站后停留的时间,然后是否再去搜索同样的词,然后给相应的网站进行动态的加权或者降权,个人认为百度比较偏向的,前一阵子有一个名为百度点击器的东西,号称三个小时上首页,一下火了整个互联网,当然火了就意味着要完蛋了,这个东西的原理就是根据Directhit算法来设计的,通过更换IP来模拟用户的行为去点击某个网站已达到排名迅速上升的目的,当然现在百度已经做出了相应的调整这东西早就不能用了,如果再去用无疑使自取灭亡。这种算法笔者认为是越来越重要了,因为搜索引擎不影响站长去控制他的排名,用户体验站长总是控制不了的吧,所以只能把内容做好才能留住用户。这种算法的弊端就是对排名后面的网站有点不公平,用户压根不会点击怎么办,所以有的时候搜索引擎会把完全没有理由进入首页的网站放到首页,如果你的站是这样的不要激动,过几天就会下去的,因为搜索引擎就是要为了搜集用户体验度。
    3.PageRank算法:PR的算法相信大家也很熟悉了,也就是链接你的网站或某个网页的数量越多说明你的网页的质量或者说是权威性越高,你的排名就很好,有的人就问了,PR是谷歌的关百度什么事,百度也有一个类似PR的东西只不过没有公布出来,现在一些百度权重不是百度本身的是第三方网站根据关键词在百度的排名而计算出来的。第三方网站的百度权重是有很大的局限性的,不能计算长尾关键词的排名而且也是可操纵的,不要尽新,百度也说过最近会出一个类似谷歌PR的权重值。
  • 关注下方微信公众号,在线模考后查看

热门试题