红联Linux门户
Linux帮助

Xsoup 0.2.0发布,HTML抽取器

发布时间:2014-03-11 15:45:43来源:红联作者:empast
Xsoup 是一款基于 Jsoup 开发的,使用XPath抽取Html元素的工具。它被用于作者的爬虫框架 WebMagic 中,进行XPath 解析和抽取。

此次更新主要增加了一些XPath语法的支持。

增加contains支持 #2:
增加筛选条件的逻辑运算支持(and/or) #4:
增加整个XPath的或支持 #6:

此次升级与Xsoup 0.1.0 API兼容,WebMagic 0.3.0以上的用户可以直接在项目添加依赖即可使用新语法。

项目主页:https://github.com/code4craft/xsoup

下载地址:https://github.com/code4craft/xsoup/releases

来自:oschina开源中国社区
文章评论

共有 0 条评论