我想将原始html代码转换为pdf文件。
这是我的控制器代码
@RequestMapping("getpdf")
public void doGet(HttpServletRequest request,
HttpServletResponse response,String ref){
OutputStream out = null;
Document document = new Document(PageSize.A4, 50, 50, 50, 50);
java.util.List items = null;
ArticalBean abean=serviceLayer.getArtical(Integer.parseInt(ref));
items = new ArrayList();
items.add(abean.getArticle());
try {
response.setContentType("application/pdf");
PdfWriter.getInstance(document, response.getOutputStream());
document.open();
Paragraph paragraph = new Paragraph("Microweb Systems");
document.add(paragraph);
ListItem listItem;
com.lowagie.text.List list = new com.lowagie.text.List(true, 15);
Iterator i = items.iterator();
while(i.hasNext()) {
listItem = new ListItem((String)i.next(),
FontFactory.getFont(FontFactory.TIMES_ROMAN, 12));
list.add(listItem);
}
document.add(list);
} catch (Exception e) {
} finally {
document.close();
}
document.close();
}
它将HTML代码转换为PDF,但该pdf也包含标签
喜欢
<h1>Hello World</h1>
是否有任何方法可以删除这些标签并仅显示数据。
我正在通过DTO从数据库提供数据。
最佳答案
如果我理解您的问题,则要删除标签。
这可以通过String.replaceAll(String regex, String replacement)
完成。
例如,myString.replaceAll("^<[.]*>$" , "");
将删除所有标签。
但是,这不会使pdf看起来像页面在浏览器中的样子。