代码拉取完成,页面将自动刷新
import re
import urllib.request
import time
# proxy = urllib.request.ProxyHandler({"http" :"183.172.192.248:1080"})
# opener = urllib.request.build_opener(proxy ,urllib.request.HTTPHandler)
# urllib.request.install_opener(opener)
count = 0
try:
for c in range(0,10):
new_url = "http://bbs.zol.com.cn/dcbbs/d33975_good_p" + str(c) + ".html#c"
data_new = urllib.request.urlopen(new_url).read().decode("utf-8","ignore")
tj_new = 'data-url="/dcbbs/(.*?).html">'
p1 = re.compile(tj_new).findall(str(data_new))
for sen in range(len(p1)):
url = "http://bbs.zol.com.cn/dcbbs/" + str(p1[sen]) + ".html"
data = urllib.request.urlopen(url).read().decode("GBK","ignore")
tj = 'data-original="https://bbs-fd.zol-img.com.cn/t_s(.*?).jpg'
p = re.compile(tj).findall(data)
for i in range(len(p)):
url = "https://bbs-fd.zol-img.com.cn/t_s" + str(p[i]) + ".jpg"
file = "d:/zol/" + str(p[i][-8:-1]) + ".jpg"
count +=1
if count%5 ==0:
time.sleep(0.65)
print("正在保存第%s张图片" % count)
urllib.request.urlretrieve(url,filename=file)
except urllib.error.URLError as e:
if hasattr(e, 'code'):
print(e.code)
if hasattr(e, "reason"):
print(e.reason)
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。