1 Star 0 Fork 0

UnlightedOtaku/spider_practice

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
3.py 611 Bytes
一键复制 编辑 原始数据 按行查看 历史
UnlightedOtaku 提交于 2020-07-06 05:39 . Initial commit
# 进入文章列表页面,获得每一篇文章的题目和摘要并保存在本地。
# 容易发现标题是h3,摘要是p
import requests
from bs4 import BeautifulSoup
url = 'http://47.104.29.136:8000/tasks/article/list/'
parser = 'html.parser'
result = requests.get(url)
# 解析网页
soup = BeautifulSoup(result.text, parser)
# 找到标题 摘要
titles = soup.find_all('h3')
abs = soup.find_all('p')
# 可能有编码问题,介意的请自行调整
f = open('3result.txt', 'w')
for i in range(len(titles)):
f.write('title:'+titles[i].get_text()+'\nabs:'+abs[i].get_text()+'\n\n')
f.close()
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
1
https://gitee.com/yangguangfeifei/spider_practice.git
git@gitee.com:yangguangfeifei/spider_practice.git
yangguangfeifei
spider_practice
spider_practice
master

搜索帮助