Apache Anything To Triples(any23)是一个库、Web 服务和命令行工具,它从各种 Web 文档中提取 RDF 格式的结构化数据。 目前支持以下格式:
RDF/XML、Turtle、Notation 3
RDFa
Microformats1、Microformats2
JSON-LD
HTML5 Microdata
CSV
Vocabularies
YAML
部分更新内容:
Sub-task
大修 README.txt
Task
更新 OpenRDF Sesame 至 2.7.0 版本
解决与 1.1#1 RC 的问题
Improvement
将命令行工具拆分为单独的模块
向 HTMLMetaExtractor 添加缺少的 元素属性
实施 Microformats2
将 Open Graph Protocol 和 Facebook 前缀添加到 Popular.prefix
更新至 Tika 1.7
在数据提取文档源示例中的小错字
Any23 不在 JDK1.8 下构建
下载地址:
http://any23.apache.org/download.html
软件详情:https://github.com/apache/any23/blob/any23-2.0/RELEASE-NOTES.txt
来自:开源中国社区

