本站搜狗Rank升至21摘自:danawa.com.cn
2009年08月18日
今天无意间发现本站的搜狗Rank为21。于是在网上找来些关于搜狗Rank的介绍,转载一篇 搜狗算法与搜狗Rank 网页评级(Sogou Rank)是搜狗衡量网页重要性的指标,不仅考察了网页之间链接关系,同时考察了链接质量、链接之间的相关性等特性,是机器根据Sogou Rank算法自动计算出来的,值从0至100不等。网页评级越高,该网页在搜索中越容易被检索到。 而实际上搜狗的PR算法是极其简单的,目前没发现有如何奥妙所在,主要是搜狗的机器人对目标网站的检索速度和频率有直接关系,如果你屏蔽了这个搜狗的机器人,相对来说你的搜狗PR会很低的咯。 另外针对搜狗机器人的抓取习惯,如果合理的结构适合搜狗对于网页内容的提取,并且页面大小适中会在搜狗中获得不小的收获。 在搜狗搜索引擎中我们发现一个有趣的现象。搜狗对每个URL的评级同URL页面的标题、摘要、链接、大小、更新时间等信息都会有直接或间接的联系。 同其他搜索引擎一样,被搜索引擎重视的大的数据来源的网站上的链接是宝贵的。 这些网站链出的资源都是非常有说服力的(绝大部分) 在天极网中某位作者也曾提过这里问题,但是涉及不深,让不明白的人看了只会更加糊涂。 而在搜狗搜索引擎中同GOOGLE的PR评级是一样的他们只针对每个域名进行数据分析和综合评价。 例如:www.danawa.com.cn 同 danawa.com.cn 他们的评价可能是不同的,但是大拿网在danawa.com.cn处理上使用了301技术,也就杜绝了这种页面和地址的出现。而实际上的搜狗对每个频道的友好度作为判定的标准,但是首页总会有比其他频道高处一些的理由,列入作为全站的信息指南和导航页。这样处理起来,对搜索引擎中的爬虫来说就好比给他们指清了道路,只要你想爬,就有路走就是了。 针对搜狗的基本算法中 同样搜狗也借鉴了许多知名搜索引擎的算法机制。我们可以把网站分为4等(粗略分)。 A:门户 B:知名 C:普通 D:垃圾站点 E:目标网站 那么搜索引擎基本上是通过以上来判定的例如 E为目标网站 那么A(B)→E 有链接,那么任何搜索引擎都回对E另眼相看的,只要权值是高了。也就是我们通常说的高看一眼。 如果E→A(B)有链接,那么很多搜索引擎是不会处理这类连接的,但是inktomi搜索引擎,YAHOO收购的这家搜索引擎的算法却和欧洲及北美很多搜索引擎的算法一样,他们同样认为E是有价值的,会给适当的权值。 同样如果E→D有连接,那么几乎所有的搜索引擎都会同样认为E也是垃圾站点,因为E给D带来了部分的支持,可是说是助纣为虐,当然要被惩罚咯。 而D链接到E,一个被视为垃圾站点的网站,基本上他的外链可以说是无效的,和没有意义的了 。 搜狗的更新时间大概是1周 ,如果您的网站1周没有在搜狗有更新那就要看看是不是有问题了。 百度10天左右,GOOGLE一周,雅虎2-4周。。。为什么雅虎需要那么多时间?我一直在分析雅虎,雅虎很长一段时间几乎并不抓取新的数据了,因为雅虎在马云大哥的领导下正在亏损。所以可能为了节省YAHOO中国本身的财政支出,所以几乎停止了新的数据的抓取。 等等观察再说! 返回顶部↑
这篇文章是否对你有帮助?
姓名:
内容:
* 评论在FireFox下使用存在BUG,我将尽快想办法修复。请使用IE发表,谢谢
|
搜 索
作 品
标 签
分 类
|