我正在使用Jinja2生成通常非常大的HTML文件。我注意到生成的HTML有很多空白。有没有可以用来最小化此HTML的纯Python工具?当我说“最小化”时,是指从HTML中删除不必要的空格(就像Google一样-例如,查看google.com的源代码)

我不想依靠诸如整洁的库/外部可执行文件。

为了进一步澄清,实际上没有JavaScript代码。仅HTML内容。

最佳答案

如果您只想摆脱多余的空格,可以使用:

>>> import re
>>> html_string = re.sub(r'\s\s+', ' ', html_string)

或者:
>>> html_string = ' '.join(html_string.split())

如果您想做的事情不仅仅是剥离多余的空格,还需要使用更强大的工具(或更复杂的正则表达式)。

10-07 17:18