1 Star 0 Fork 0

周欣/爬虫zy

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
文件
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
23.3 723 Bytes
一键复制 编辑 原始数据 按行查看 历史
周欣 提交于 2021-09-23 08:58 . add 23.3.
# 1、图片链接
# 2、星级
# 3、书名
# 4、价格
import requests
from lxml import etree
url = 'https://books.toscrape.com/'
response = requests.get(url)
print(response.status_code)
# print(response.text)
html = response.text
# xpath的使用
# 1、得到一个etree对象
ehtml = etree.HTML(html)
# 2、通过xpath查找
# 图片链接
xtitle = ehtml.xpath("//div[@class='image_container']/a//@src")
print(xtitle)
# 星级
xtitle = ehtml.xpath("//article[@class='product_pod']/p[1]/@class[1]")
print(xtitle)
# 书名
xtitle = ehtml.xpath("//article[@class='product_pod']/h3//@title")
print(xtitle)
# 价格
xtitle = ehtml.xpath("//div[@class='product_price']/p[1]/text()")
print(xtitle)
Loading...
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
1
https://gitee.com/zhou-xin607/zx2.git
git@gitee.com:zhou-xin607/zx2.git
zhou-xin607
zx2
爬虫zy
master

搜索帮助

0d507c66 1850385 C8b1a773 1850385