红联Linux门户
Linux帮助

Html文档解析器 HtmlCleaner

发布时间:2013-10-02 09:21:22来源:红联作者:empast
HtmlCleaner是一个开源的Java语言的Html文档解析器。HtmlCleaner能够重新整理HTML文档的每个元素并生成结构良好(Well-Formed)的 HTML 文档。默认它遵循的规则是类似于大部份web浏览器为创文档对象模型所使用的规则。然而,用户可以提供自定义tag和规则组来进行过滤和匹配。

官方首页:http://sourceforge.net/projects/htmlcleaner/

免费下载:http://sourceforge.net/projects/htmlcleaner/files/

来自:开源中国社区
文章评论

共有 0 条评论