花一些时间研究pycurl和libcurl文档,我仍然找不到(简单)的方法,如何在pycurl中获取HTTP状态消息(原因短语)。

状态码很简单:

import pycurl
import cStringIO

curl = pycurl.Curl()
buff = cStringIO.StringIO()
curl.setopt(pycurl.URL, 'http://example.org')
curl.setopt(pycurl.WRITEFUNCTION, buff.write)
curl.perform()

print "status code: %s" % curl.getinfo(pycurl.HTTP_CODE)
# -> 200

# print "status message: %s" % ???
# -> "OK"

最佳答案

我自己找到了一个解决方案,它可以满足我的需要,但是可以更强大(适用于HTTP)。

它基于pycurl.HEADERFUNCTION获得的已捕获 header 包含状态行这一事实。

import pycurl
import cStringIO
import re

curl = pycurl.Curl()

buff = cStringIO.StringIO()
hdr = cStringIO.StringIO()

curl.setopt(pycurl.URL, 'http://example.org')
curl.setopt(pycurl.WRITEFUNCTION, buff.write)
curl.setopt(pycurl.HEADERFUNCTION, hdr.write)
curl.perform()

print "status code: %s" % curl.getinfo(pycurl.HTTP_CODE)
# -> 200

status_line = hdr.getvalue().splitlines()[0]
m = re.match(r'HTTP\/\S*\s*\d+\s*(.*?)\s*$', status_line)
if m:
    status_message = m.groups(1)
else:
    status_message = ''

print "status message: %s" % status_message
# -> "OK"

关于python - 如何在(py)curl中获取HTTP状态消息?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/2723715/

10-12 23:44