当前位置:首页 » 运营知识 » 正文

国内外主流知名爬虫列表大全,如何屏蔽不想要的蜘蛛爬虫,京策高防CDN一键拦截爬虫

国内外主流知名爬虫列表大全,如何屏蔽不想要的蜘蛛爬虫,京策高防CDN一键拦截爬虫

 

以下是一些知名的网络爬虫列表(不包括所有,且可能随时间变化):

  1. Googlebot:谷歌搜索引擎的爬虫,用于抓取网页内容以更新谷歌搜索索引。

  2. Bingbot:微软Bing搜索引擎的爬虫,用于索引网页内容。

  3. Slurp(现为DuckDuckBot):DuckDuckGo搜索引擎的爬虫,用于抓取和索引网页。

  4. Baiduspider:百度搜索引擎的爬虫,用于抓取中文网页内容。

  5. YandexBot:Yandex搜索引擎(主要服务于俄罗斯市场)的爬虫。

  6. Sogou Spider:搜狗搜索引擎的爬虫,用于抓取中文网页内容。

  7. Exabot(现为Internet Archive的爬虫之一):曾经是一个独立的搜索引擎爬虫,现在被用于Internet Archive的项目中。

  8. Nutch:一个开源的搜索引擎爬虫,常被用于构建自定义搜索引擎。

  9. Scrapy:虽然不是一个特定的爬虫,但它是一个流行的Python库,用于编写网络爬虫来抓取网站数据。

  10. MajesticSEO(现为Majestic):一个提供网站分析和SEO服务的公司,其爬虫用于收集网站数据。

  11. AhrefsBot:Ahrefs网站分析工具的爬虫,用于抓取网页链接和数据。

  12. SemrushBot:Semrush竞争情报和SEO分析工具的爬虫。

  13. MJ12bot:Majestic-12(一个网站分析和链接检查服务)的爬虫。

  14. DotBot:Mozilla的爬虫,用于支持其开源项目和研究。

  15. CommonCrawl:一个开源的网络爬虫项目,定期抓取互联网上的大量数据,并供公众使用。

请注意,这个列表只是众多网络爬虫中的一小部分,而且爬虫的具体名称和行为可能会随着时间和版本更新而发生变化。

使用京策盾高防CDN可以完美杜绝这个问题,京策盾高防CDN已经内置了各种主流蜘蛛与恶意蜘蛛库,可以做到一键放行和拦截,避免您修改代码和环境的烦恼

京策盾高防CDN或者京策盾高防IP产品

京策盾高防CDNhttps://www.jcdun.com/guoneigaofangcdn

京策盾高防IPhttps://www.jcdun.com/guoneigaofangip

分享到
上一篇
下一篇

相关推荐

联系我们

kakuyunke

复制已复制
4692403复制已复制
kefu#0ka.co复制已复制
微信小程序
kakuyunke复制已复制
关注官方微信,了解最新资讯
contact-img
客服QQ
在线客服