python urllib2 抓取网页如何捕获各种异常呢

power0811 2010-01-06 05:16:04

我用python的 urllib2来抓取网页怎么才能捕获各种返回的异常呢?
有如下代码:



import urllib2



if __name__ == '__main__':

    url = 'http://hh'

    try:

        urllib2.urlopen(url, timeout=5)

    except URLError, e:

        print e.reason

我捕获异常却提示这种错误:
except URLError, e:
NameError: name 'URLError' is not defined
是怎么回事为什么说我未定义呢?
该怎么改才可以呢
还有麻烦告知一下网页各种返回错误怎么捕获呢

...全文

1164 2 打赏收藏转发到动态举报

写回复

用AI写文章

2 条回复

切换为时间正序

请发表友善的回复…

发表回复

notax 2010-01-07

打赏
举报

[Quote=引用楼主 power0811 的回复:]
我用python的 urllib2来抓取网页怎么才能捕获各种返回的异常呢?
有如下代码:
Python codeimport urllib2if__name__=='__main__':
url='http://hh'try:
urllib2.urlopen(url, timeout=5)except URLError, e:print e.reason

我捕获异常却提示这种错误:
except URLError, e:
NameError: name 'URLError' is not defined
是怎么回事为什么说我未定义呢?
该怎么改才可以呢
还有麻烦告知一下网页各种返回错误怎么捕获呢
[/Quote]

python 2.6

except urllib2.URLError, e:

or

except Exception, e: #捕获各种已定义返回错误

or

try
.....
except: #catch all exceptions
print sys.exc_info() #print all traceback exceptions, for debugging

damingg 2010-01-07

打赏
举报

可能是没导入合适的库
不是有个更好的例子么
from urllib2 import Request, urlopen, URLError, HTTPError
req = Request(someurl)
try:
response = urlopen(req)
except HTTPError, e:
print 'The server couldn\'t fulfill the request.'
print 'Error code: ', e.code
except URLError, e:
print 'We failed to reach a server.'
print 'Reason: ', e.reason
else:
# everything is fine