我正在尝试将excel文件转换为XSSFWorkbook,我大约有7000行和大约145列。在下面的我的代码中,将Excel文件转换为第2行的XSSFWorkbook大约需要15分钟:-

InputStream fs = new FileInputStream(filename);   // (1)
XSSFWorkbook wb = new XSSFWorkbook(fs);           // (2)
XSSFSheet sheet = wb.getSheetAt(0);


与其在XFFSWorkbook中添加7000行,不如在转换第2行时在XFFSWorkbook中添加30行?

如果没有,如何减少将excel转换为XSSFWorkbook所需的时间?

最佳答案

*.xlsx文件是ZIP存档,在具有不同Excel文件的目录结构中包含XML的数据。

例如有


/xl/workbook.xml描述基本的工作簿结构,
/xl/worksheets/sheet1.xml/xl/worksheets/sheet2.xml,...
具有表数据的/xl/worksheets/sheetN.xml-这是行
而不是直接存储单元格中的所有数据
那里。同样,单元格样式不直接存储在此处。 -,
/xl/styles.xml包含单元格样式,
/xl/sharedStrings.xml包含单元格中所有字符串内容
所有工作表。这是为了避免多次存储同一字符串
如果此字符串在单元格中多次使用,则返回。


因此,如果您想读取*.xlsx ZIP存档,则需要解压缩ZIP存档,然后至少解析上述四个XML文件以获取XSSFWorkbook的数据。这是apache poiXSSFWorkbook wb = new XSSFWorkbook(fileinputstream);期间所做的。

因此,如果您确实需要XSSFWorkbook作为结果,则无法解决此过程。而且,如果您不怀疑已经编写了显式延迟例程,那么将不可能减少此过程的时间。

您只读取少于存储在工作表中的行的方法可能节省时间。但是,结果将是一个apache poi,其中包含所有样式和所有字符串内容,但仅包含与这些样式和字符串数据相关的某些工作表数据。因此,这将导致部分损坏的XSSFWorkbook。这就是为什么没人真正考虑过这种方法的原因。

仅当要求仅从其中一个XSSFWorkbook中读取原始无格式的数据而不创建/xl/worksheets/sheetN.xml时,才需要解压缩XSSFWorkbook存档,然后仅解析所需的ZIP/xl/worksheets/sheetN.xml从中获取单元格的字符串内容。比上述整个过程所需的时间更少。

关于java - 使用Apache poi将excel转换为XSSFWorkbook需要很长时间,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/46131692/

10-10 18:59