代码拉取完成,页面将自动刷新
# 1、图片链接
# 2、星级
# 3、书名
# 4、价格
import requests
from lxml import etree
url = 'https://books.toscrape.com/'
response = requests.get(url)
print(response.status_code)
# print(response.text)
html = response.text
# xpath的使用
# 1、得到一个etree对象
ehtml = etree.HTML(html)
# 2、通过xpath查找
# 图片链接
xtitle = ehtml.xpath("//div[@class='image_container']/a//@src")
print(xtitle)
# 星级
xtitle = ehtml.xpath("//article[@class='product_pod']/p[1]/@class[1]")
print(xtitle)
# 书名
xtitle = ehtml.xpath("//article[@class='product_pod']/h3//@title")
print(xtitle)
# 价格
xtitle = ehtml.xpath("//div[@class='product_price']/p[1]/text()")
print(xtitle)
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。