1 Star 0 Fork 0

周欣/爬虫zy

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
文件
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
23.1 845 Bytes
一键复制 编辑 原始数据 按行查看 历史
周欣 提交于 2021-09-23 08:57 . add 23.1.
# 1、书名
# 2、作者名
# 3、类型
# 4、更新时间
# 5、图片链接
import requests
from lxml import etree
url = 'http://book.zongheng.com/store.html'
response = requests.get(url)
print(response.status_code)
# print(response.text)
html = response.text
# xpath的使用
# 1、得到一个etree对象
ehtml = etree.HTML(html)
# 2、通过xpath查找
# 书名
xtitle = ehtml.xpath("//div[@class='bookname']/a/text()")
print(xtitle)
# 作者名
xtitle = ehtml.xpath("//div[@class='bookilnk']/a[1]/text()")
print(xtitle)
# 类型
xtitle = ehtml.xpath("//div[@class='bookilnk']/a[2]/text()")
print(xtitle)
# 更新时间
xtitle = ehtml.xpath("//div[@class='bookilnk']/span[2]/text()")
for i in xtitle:
print(i[36:47])
# 图片链接
xtitle = ehtml.xpath("//div[@class='bookimg']/a//@src")
print(xtitle)
Loading...
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
1
https://gitee.com/zhou-xin607/zx2.git
git@gitee.com:zhou-xin607/zx2.git
zhou-xin607
zx2
爬虫zy
master

搜索帮助

0d507c66 1850385 C8b1a773 1850385