1 Star 0 Fork 0

XieYeMing/python爬虫与自动化脚本

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
文件
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
Xpath.py 1.07 KB
一键复制 编辑 原始数据 按行查看 历史
XieYeMing 提交于 2024-02-16 17:44 . 练手脚本
from lxml import etree
import requests
xml = """
"""
html = """
"""
# 解析xml内容
et = etree.XML(xml)
# result = et.xpath("/book") # /表示根节点
# result = et.xpath("/book/name") # 在xpath中间的/表示的是儿子
# result = et.xpath("/book/name/text()")[0] # text()拿文本
# result = et.xpath("/book//nick") # 1/表示的是子孙后代。
# result = et.xpath("/book/*/nick/text()") # *通配符。谁都行
# result = et.xpath("/book/author/nick[@class='jay']/text()")
# result = et.xpath("/book/author/nick/@id]) # 获取author标签下面所有nick标签的id值
# print ( result)
# 解析html内容
et = etree.HTML(html)
result = et.xpath("/html/body/ul/li[2]/a/text()") # 获取网页中ul下的第二个li标签中的a标签内容 返回的是列表
result = et.xpath("//li/a/text()") # 获取网页中所有的li标签里的a标签的内容 返回的是一个迭代器
for item in result:
herf = et.xpath("./a/@href")[0] # 获取当前li标签下a标签的超链接文本
conent = et.xpath("./a/text()")[0] # 获取当前li标签下a标签的文本
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
Python
1
https://gitee.com/xieyeming/machine-study.git
git@gitee.com:xieyeming/machine-study.git
xieyeming
machine-study
python爬虫与自动化脚本
master

搜索帮助