有关于百度新闻搜索的答疑

2008-06-28   |  分类:baidu

最近一直在着手处理百度新闻搜索抓取的问题,通过与各位主编坚持不懈的努力,终于有了一点点收获,以下将百度回复的信件发布在BLOG上以帮助更多的朋友改善自己的网站内容,提高原创新闻质量

百度使用自动的spider程序抓取互联网上的网页,大多数情况下,网站都能被百度自动收录。虽然百度希望尽可能多的抓取互联网上的网页,但为了
确保用户的搜索体验以及某些不确定的原因,仍会有少数网站无法被百度收录,如果您
的网站未被收录,通常是由以下原因引起的:

 1. 您的网站所在服务器不稳定,被百度暂时性去除,稳定之后,问题会得到解决。

2. 您的网站有设计缺陷,导致spider无法正常抓取。

3. 您的网页不符合用户的搜索体验。

4. 网页是复制自互联网上的高度重复性的内容。

5. 网页做了很多针对搜索引擎而非用户的处理,使得用户从搜索结果中看到的内容与
页面实际内容完全不同,或者使得网页在搜索结果中获得了不恰当的排名,从而导致用
户产生受欺骗感觉。

6. 您的网页内容有不符合国家法律和法规规定的地方。

7. 您网站的robots协议禁止百度抓取。

8. 其他技术性问题。