我正在尝试使用apache poi将演讲者的笔记从一个PowerPoint转移到另一个PowerPoint,但我无法获得准确的转移。

环顾四周后,我找不到很多资源。我确实找到了此链接:How to get pptx slide notes text using apache poi?,并且在大多数情况下都可以使用。但是,当某些功能(例如幻灯片母版)包含在原始pptx中时,某些不属于演讲者注释的文本将被解释为演讲者注释。

XSLFNotes notes_src = slides_src[i].getNotes();
XSLFNotes notes_dst = ppt_dst.getNotesSlide(slides_dst[i]);


全部都在for循环中,其中i是迭代数。在这里,我得到源的幻灯片i和目标文件中的相应幻灯片i。

for (XSLFShape shape_src : notes_src) {
    if (shape_src instanceof XSLFTextShape) {
        XSLFTextShape txShape = (XSLFTextShape) shape_src;
        for (XSLFTextParagraph xslfParagraph : txShape.getTextParagraphs()) {


在这里,我从幻灯片中获取文本。在下面的if循环中,我必须开始过滤掉实际上不是演讲者备注的一些“演讲者”备注(例如,幻灯片编号被某种程度上解释为备注;还印有此版权符号)。

    if (!(xslfParagraph.getText().startsWith("" + (i + 1)) & xslfParagraph.getText().length() < 3) & !(xslfParagraph.getText().startsWith("Copyright ©"))) {
        for (XSLFTextShape shape_dst : notes_dst.getPlaceholders()) {
            if (shape_dst.getTextType() == Placeholder.BODY) {
                shape_dst.setText(shape_dst.getText() + xslfParagraph.getText() + "\n");


下面的语句是另一个过滤器;如果涉及到涉及主幻灯片的功能,那么奇怪的“单击以编辑主文本样式...”文本也将被解释为演讲者注释。

    shape_dst.setText(shape_dst.getText().replace("Click to edit Master text styles", "").replace("Second level", "").replace("Third level", "").replace("Fourth level", "").replace("Fifth level", ""));
}}}}}}


简而言之,不是讲者注释的内容显示为“注释”。在线上没有太多关于该主题的资源。有人可以帮忙吗?

最佳答案

XSLFSlide.getNotes得到的是笔记幻灯片。它们可能不仅具有包含注释的正文文本形状,而且还具有通过其他占位符(如页眉,页脚,日期时间和幻灯片编号)填充的文本形状。为了确定一种文本形状,可以从该形状中获取占位符类型。这是

CTShape cTShape = (CTShape)shape.getXmlObject();
STPlaceholderType.Enum type = cTShape.getNvSpPr().getNvPr().getPh().getType();


这样一来,只能得到STPlaceholderType.BODY类型的文本形状。

例:

import java.io.FileInputStream;

import org.apache.poi.xslf.usermodel.*;

import org.openxmlformats.schemas.presentationml.x2006.main.CTShape;
import org.openxmlformats.schemas.presentationml.x2006.main.STPlaceholderType;

import java.util.List;

public class PowerPointReadNotes {

 public static void main(String[] args) throws Exception {

  XMLSlideShow slideShow = new XMLSlideShow(new FileInputStream("PowerPointHavingNotes.pptx"));

  List<XSLFSlide> slides = slideShow.getSlides();
  for (XSLFSlide slide : slides) {
   XSLFNotes notes = slide.getNotes();
   for (XSLFShape shape : notes) {
    CTShape cTShape = (CTShape)shape.getXmlObject();
    STPlaceholderType.Enum type = cTShape.getNvSpPr().getNvPr().getPh().getType();
    System.out.println("type: " + type);
    if (type == STPlaceholderType.BODY) { // get only shapes of type BODY
     if (shape instanceof XSLFTextShape) {
      XSLFTextShape textShape = (XSLFTextShape) shape;
      for (XSLFTextParagraph paragraph : textShape) {
       System.out.println(paragraph.getText());
      }
     }
    }
   }
  }
 }
}


可能的类型是BODY, CHART, CLIP_ART, CTR_TITLE, DGM, DT, FTR, HDR, MEDIA, OBJ, PIC, SLD_IMG, SLD_NUM, SUB_TITLE, TBL, TITLE

不幸的是,没有关于ooxml模式公开的任何文档。因此,我们需要下载ooxml-schemas的源,然后对这些源进行javadoc处理,以获取描述类和方法的API文档。

然后,我们在其中找到org.openxmlformats.schemas.presentationml.x2006.main.*类,它们是Office Open XML表示部分的类。可以在/org/openxmlformats/schemas/presentationml/x2006/main/CTShape.html创建的API文档中查看javadoc,然后前进getNvSpPr()-getNvPr()-getPh()-getType()



使用当前的apache poi 4.1.0,可以使用高级API中的枚举Placeholder

例:

import java.io.FileInputStream;

import org.apache.poi.xslf.usermodel.*;
import org.apache.poi.sl.usermodel.Placeholder;

import java.util.List;

public class PowerPointReadNotesHL {

 public static void main(String[] args) throws Exception {

  XMLSlideShow slideShow = new XMLSlideShow(new FileInputStream("PowerPointHavingNotes.pptx"));

  List<XSLFSlide> slides = slideShow.getSlides();
  for (XSLFSlide slide : slides) {
   XSLFNotes notes = slide.getNotes();
   for (XSLFShape shape : notes) {
    Placeholder placeholder = shape.getPlaceholder();
    System.out.println("placeholder: " + placeholder);
    if (placeholder == Placeholder.BODY) { // get only shapes of type BODY
     if (shape instanceof XSLFTextShape) {
      XSLFTextShape textShape = (XSLFTextShape) shape;
      for (XSLFTextParagraph paragraph : textShape) {
       System.out.println(paragraph.getText());
      }
     }
    }
   }
  }
 }
}


这样就不必直接使用低级ooxml-schema类。

10-06 06:09