转载

轻量化易用网络爬虫Gecco v1.2.2 发布

轻量化易用网络爬虫Gecco v1.2.2 发布

Gecco是一款用java语言开发的轻量化的易用的网络爬虫。Gecco整合了jsoup、httpclient、fastjson、spring、htmlunit、redission等优秀框架,让您只需要配置一些jquery风格的选择器就能很快的写出一个爬虫。Gecco框架有优秀的可扩展性,框架基于开闭原则进行设计,对修改关闭、对扩展开放。同时Gecco基于十分开放的MIT开源协议。

更新日志

  1. 修复UniqueSpiderScheduler的排序错误
  2. DynamicGecco稳定版,支持动态改变抓取规则
  3. JsonPipeline,提供运行时生产SpiderBean时使用
  4. 支持tomcat等非双亲委派模型的ClassLoader

下载

正文到此结束
Loading...