
Linuxeden 开源社区 --
Apache Tika 1.15 发布了,该版本包含许多改进和错误修复。新发布的版本已推送到 Apache 发布网站以及 Maven Central。
Tika 是一个内容抽取的工具集合 (a toolkit for text extracting)。它集成了 POI 和 Pdfbox,并且为文本抽取工作提供了一个统一的界面。其次,Tika 也提供了便利的扩展 API,用来丰富其对第三方文件格式的支持。
下载地址
转自 http://ift.tt/2rhIv1f
The post Apache Tika 1.15 发布 ,内容抽取工具集合 appeared first on Linuxeden开源社区.
http://ift.tt/2qxOuSx
没有评论:
发表评论