现在的位置: 首页 > 综合 > 正文

关于apache tika应用于android项目中的调查分析

2017年10月11日 ⁄ 综合 ⁄ 共 397字 ⁄ 字号 评论关闭

最近一直在为android应用解析microsoft office文档发愁。

因为需求的原因,文档的解析只能放到客户端来做。

之前使用POI解析doc文档,但是需要做的判断很多,比如文字大小、颜色、加粗、斜体、表格、图片等等。

而且在文档图片过多的情况下很容易产生内存溢出的问题,这就需要对解析的过程做优化,比如说屏幕滚动时,清空不在屏幕上的图片。

这些东西都是从来没接触过的,都需要调查,但是调查的进展很慢,没有好的思路。


最近发现了一个叫做apache tika的东西,非常不错,值得研究。

支持大部分文件格式。但是在android项目中使用需要考虑的问题挺多,比如说做word2003文档解析,就要额外导入POI的jar包。

不然tika中的一些依赖POI方法不能正确执行。

现在痛苦于,tika解析出的word文档,不能解析图片和表格,纠结中...谁有做过带图片表格的word文档解析,在android端~

抱歉!评论已关闭.