Gecco 1.1.3 发布了,该版本改进内容包括:
1.处理jsonp的时候,分号问题修复
2.支持自定义下载重试次数定义,GeccoEngine.retry(count)
3.HttpClientDownloader支持response的Set Cookie自动存储
4.修改以支持JSON的JsonBean递归解析 by shangjian
Gecco是一款用java语言开发的轻量化的易用的网络爬虫。Gecco整合了jsoup、httpclient、fastjson、spring、 htmlunit、redission等优秀框架,让您只需要配置一些jquery风格的选择器就能很快的写出一个爬虫。Gecco框架有优秀的可扩展 性,框架基于开闭原则进行设计,对修改关闭、对扩展开放。
软件详情:http://mvnrepository.com/artifact/com.geccocrawler/gecco
下载地址:https://github.com/xtuhcy/gecco
来自:开源中国社区