代码拉取完成,页面将自动刷新
# 1、书名
# 2、作者名
# 3、类型
# 4、更新时间
# 5、图片链接
import requests
from lxml import etree
url = 'http://book.zongheng.com/store.html'
response = requests.get(url)
print(response.status_code)
# print(response.text)
html = response.text
# xpath的使用
# 1、得到一个etree对象
ehtml = etree.HTML(html)
# 2、通过xpath查找
# 书名
xtitle = ehtml.xpath("//div[@class='bookname']/a/text()")
print(xtitle)
# 作者名
xtitle = ehtml.xpath("//div[@class='bookilnk']/a[1]/text()")
print(xtitle)
# 类型
xtitle = ehtml.xpath("//div[@class='bookilnk']/a[2]/text()")
print(xtitle)
# 更新时间
xtitle = ehtml.xpath("//div[@class='bookilnk']/span[2]/text()")
for i in xtitle:
print(i[36:47])
# 图片链接
xtitle = ehtml.xpath("//div[@class='bookimg']/a//@src")
print(xtitle)
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。