红联Linux门户
Linux帮助

JsoupXPath v0.3.0发布,html解析器

发布时间:2016-06-07 09:43:04来源:红联作者:baihuo
JsoupXPath v0.3.0 发布了,JsoupXpath 是一款纯Java开发的使用xpath解析html的解析器,xpath语法分析与执行完全独立,html的DOM树生成借助Jsoup,故命名为JsoupXpath. 为了在java里也享受xpath的强大与方便但又苦于找不到一款足够强大的xpath解析器,故开发了JsoupXpath。JsoupXpath的实现逻辑清晰,扩展方便, 支持几乎全部常用的xpath语法。

改进日志如下:

v0.3.0

JXDocument中增加public List selN(String xpath)方法,提取结果可继续执行XPath提取[code]@Test
@DataProvider(value = {
"//ul[@class='subject-list']/li"
})
public void testJXNode(String xpath) throws XpathSyntaxErrorException {
System.out.println("current xpath:" + xpath);
List jxNodeList = doubanTest.selN(xpath);
for (JXNode node : jxNodeList) {
if (!node.isText()) {
System.out.println(StringUtils.join(node.sel("/div/h2/a/text()"), ""));
}
}
}[/code]完整示例请参见JXDocumentTest:https://github.com/zhegexiaohuozi/JsoupXpath/blob/master/src/test/java/cn/wanghaomiao/xpath/model/JXDocumentTest.java

依赖包commons-lang升级到commons-lang3

修复已知Bug,在此感谢@suclogger的Merge Request

软件详情:https://github.com/zhegexiaohuozi/JsoupXpath

来自:开源中国社区
文章评论

共有 0 条评论