代码拉取完成,页面将自动刷新
#from bs4.element import Script
import requests
from bs4 import BeautifulSoup
import json
import re
#发送请求获取疫情数据的首页
home_page = requests.get('http://ncov.dxy.cn/ncovh5/view/pneumonia')
#变为utf8的编码
page = home_page.content.decode()
#找到里面的数据的标签
#创建解析对象
soup = BeautifulSoup(page,"lxml")
script = soup.find(id="getListByCountryTypeService2true")
script_data= script.string
#利用正则提取数据,是json字符串
json_str = re.findall(r'(\[.+\])',script_data)[0]
#将json字符串转为python数据
py_data = json.loads(json_str)
print(py_data)
# #将python数据保存到文件
with open('./public/data/getListByCountryTypeService2true.json','w',encoding='utf8') as fp:
json.dump(py_data,fp,ensure_ascii=False)
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。