我很高兴的宣布 jsoup 1.7.2 发布了,该版本引入了结构化伪码 CSS 类的选择器,包括::first-child, :last-child, :nth-child, :nth-last-child,:first-of-type, :last-of-type, :nth-of-type, :nth-last-of-type,:only-child, :only-of-type, :empty, and :root。完全支持国际化补充字符,其他方面的提升和 bug 修复。
jsoup 是一款 Java 的HTML 解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于JQuery的操作方法来取出和操作数据。
相关链接:
http://jsoup.org/
http://jsoup.org/download
http://jsoup.org/news/release-1.7.2
来自:开源中国社区

