我正在尝试将excel文件转换为XSSFWorkbook,我大约有7000行和大约145列。在下面的我的代码中,将Excel文件转换为第2行的XSSFWorkbook大约需要15分钟:-
InputStream fs = new FileInputStream(filename); // (1)
XSSFWorkbook wb = new XSSFWorkbook(fs); // (2)
XSSFSheet sheet = wb.getSheetAt(0);
与其在XFFSWorkbook中添加7000行,不如在转换第2行时在XFFSWorkbook中添加30行?
如果没有,如何减少将excel转换为XSSFWorkbook所需的时间?
最佳答案
*.xlsx
文件是ZIP
存档,在具有不同Excel
文件的目录结构中包含XML
的数据。
例如有/xl/workbook.xml
描述基本的工作簿结构,/xl/worksheets/sheet1.xml
,/xl/worksheets/sheet2.xml
,...
具有表数据的/xl/worksheets/sheetN.xml
-这是行
而不是直接存储单元格中的所有数据
那里。同样,单元格样式不直接存储在此处。 -,/xl/styles.xml
包含单元格样式,/xl/sharedStrings.xml
包含单元格中所有字符串内容
所有工作表。这是为了避免多次存储同一字符串
如果此字符串在单元格中多次使用,则返回。
因此,如果您想读取*.xlsx
ZIP
存档,则需要解压缩ZIP
存档,然后至少解析上述四个XML
文件以获取XSSFWorkbook
的数据。这是apache poi
在XSSFWorkbook wb = new XSSFWorkbook(fileinputstream);
期间所做的。
因此,如果您确实需要XSSFWorkbook
作为结果,则无法解决此过程。而且,如果您不怀疑已经编写了显式延迟例程,那么将不可能减少此过程的时间。
您只读取少于存储在工作表中的行的方法可能节省时间。但是,结果将是一个apache poi
,其中包含所有样式和所有字符串内容,但仅包含与这些样式和字符串数据相关的某些工作表数据。因此,这将导致部分损坏的XSSFWorkbook
。这就是为什么没人真正考虑过这种方法的原因。
仅当要求仅从其中一个XSSFWorkbook
中读取原始无格式的数据而不创建/xl/worksheets/sheetN.xml
时,才需要解压缩XSSFWorkbook
存档,然后仅解析所需的ZIP
和/xl/worksheets/sheetN.xml
从中获取单元格的字符串内容。比上述整个过程所需的时间更少。
关于java - 使用Apache poi将excel转换为XSSFWorkbook需要很长时间,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/46131692/