红联Linux门户
Linux帮助

doc及docx纯文本提取 DocumentExtractor

发布时间:2013-03-01 09:10:40来源:红联作者:empast
在日常的很多项目中我们总会遇到各种各样的格式转换问题,这让我头疼不已。尤其是在window占领pc机大部分系统的今天,doc及docx格式虽然已经开放,但是对于一个一般开发者来说依然无法处理。所以我们研究了doc及docx文件格式写出了DocumentExtractor。

本项目简单易用,对外接口仅有三个分别为open ,getText ,close ,简单明了,易于使用。同时这仅仅是一个草稿版本,在构架及代码设计方面存在很多问题。

项目主页:http://www.yankodesign.com/2010/11/25/print-that-screen-literally/

来自:开源中国社区
文章评论

共有 0 条评论