如何降低网页相似度
Posted in 未分类 on 03/09/2010 11:22 下午 by Marts什么是网页相似度:
相似度,一般大家的观点是包括两个方面.
一是相对站外的页面,也就是所谓的重复性,这个是无法避免的.尤其是在采集的站点会特别严重.
二是相对于网站自身而言.网上有很多在线计算网页相似度的工具,你可以去找找.算法很简单,根据重复率计算. 使用CMS建站的话,尽量不要让框架文字代码大于页面的实际页面文字.
搜索引擎如何辨相似度:
1. 根据网页摘要来比较,如果多个网页摘要的 md5 值一样,证明这些网页有很高的相似性。
2. 根据网页出现关键词,按照词频排序,可以取N个词频高的,如果md5 值一样,证明这些网页有很高的相似性。
网页相似度对SEO的影响:
Google 对网页相似度限制在60%,如果超过这个标准将导致页面不被收录,或者收录后排名靠后中。在百度中也是一样的。
1. 网站页面低于 60%,将保证搜索引擎收录正常。
2. 搜索引擎除了比较同一个网站的网页相似度,还要比较该网页同其他网站的网页的相似度。所以要增加原创内容,减少转载内容。
如果降低网页的相似度:
1>功能性强的页面内容用js调用
2>描述写在title前面,主描述字段长点。
3>把不同的字段多重复几次,结合到内容中。
4>调整站内结构 增加相关度内容