我想将原始html代码转换为pdf文件。
这是我的控制器代码

@RequestMapping("getpdf")
public void doGet(HttpServletRequest request,
        HttpServletResponse response,String ref){


    OutputStream out = null;
    Document document = new Document(PageSize.A4, 50, 50, 50, 50);
    java.util.List items = null;

    ArticalBean abean=serviceLayer.getArtical(Integer.parseInt(ref));
        items = new ArrayList();
        items.add(abean.getArticle());


    try {
        response.setContentType("application/pdf");
        PdfWriter.getInstance(document, response.getOutputStream());
        document.open();
        Paragraph paragraph = new Paragraph("Microweb Systems");
        document.add(paragraph);
        ListItem listItem;
        com.lowagie.text.List list = new com.lowagie.text.List(true, 15);
        Iterator i = items.iterator();
        while(i.hasNext()) {
            listItem = new ListItem((String)i.next(),
                    FontFactory.getFont(FontFactory.TIMES_ROMAN, 12));

            list.add(listItem);
        }
        document.add(list);

    } catch (Exception e) {

    } finally {
        document.close();
    }
    document.close();
}


它将HTML代码转换为PDF,但该pdf也包含标签

喜欢

<h1>Hello World</h1>


是否有任何方法可以删除这些标签并仅显示数据。

我正在通过DTO从数据库提供数据。

最佳答案

如果我理解您的问题,则要删除标签。

这可以通过String.replaceAll(String regex, String replacement)完成。

例如,myString.replaceAll("^<[.]*>$" , "");将删除所有标签。
但是,这不会使pdf看起来像页面在浏览器中的样子。

09-30 15:24
查看更多