红联Linux门户
Linux帮助

Gecco 1.2.2发布,首个支持动态加载的java爬虫框架

发布时间:2016-07-18 11:12:22来源:红联作者:baihuo
Gecco 1.2.2 发布了,DynamicGecco实现了爬虫规则的热部署,是首个支持动态加载的java爬虫框架。

DynamicGecco的目的是在不定义SpiderBean的情况下实现爬取规则的运行时配置。其实现原理是采用字节码编程,动态生成SpiderBean,而且通过自定义的GeccoClassLoader实现了抓取规则的热部署。使用方法可以参考《教您使用DynamicGecco抓取JD全部商品信息》这个DEMO:http://www.geccocrawler.com/dynamic-demo-jd/

其他优化:修复了UniqueSpiderScheduler的排序错误的bug

软件详情:http://www.geccocrawler.com/dynamic-demo-jd/

下载地址:http://mvnrepository.com/artifact/com.geccocrawler/gecco

来自:开源中国社区
文章评论

共有 0 条评论