1 Star 0 Fork 0

XieYeMing/python爬虫与自动化脚本

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
文件
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
电影天堂.py 1008 Bytes
一键复制 编辑 原始数据 按行查看 历史
XieYeMing 提交于 2024-02-16 17:44 . 练手脚本
import requests
import re
f = open('电影天堂.scv', 'a+', encoding='utf-8')
href = ""
url = "https://www.dy2018.com/"+href
headers = {
}
result = requests.get(url)
result.encoding = 'gb2312'
date = result.text
compiles = re.compile(r'2023必看热片.*?<ul>(?P<html>.*?)</ul>', re.S)
href = re.compile(r"<li><a href='(?P<aurl>.*?)' title=", re.S)
# 详情页的正则表达式
dateils_compile = re.compile(r'<td colspan="2" align="center" valign="top"><div id="Zoom">.*?片  名'
r'(?P<moviename>.*?)<br />.*?<td style="WORD-WRAP: break-word" bgcolor="#fdfddf"><a href="(?P<download>.*?)">', re.S)
movie = compiles.search(date)
# print(movie.group("html"))
aurl = href.finditer(movie.group("html"))
for item in aurl:
herf = item.group("aurl")
url = url.strip("/")+herf
dateils = requests.get(url)
dateils.encoding = "gb2312"
scvstr = dateils_compile.search(dateils.text)
print(scvstr.group("moviename"), scvstr.group("download"))
break
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
Python
1
https://gitee.com/xieyeming/machine-study.git
git@gitee.com:xieyeming/machine-study.git
xieyeming
machine-study
python爬虫与自动化脚本
master

搜索帮助

0d507c66 1850385 C8b1a773 1850385