代码拉取完成,页面将自动刷新
from bs4 import BeautifulSoup
import urllib.request
import re
soup = BeautifulSoup(open("comment_element.html"))
d = {}
for tag in soup.find_all(["button","emoji-mart-emoji"]):
s = tag.find("span")["style"]
pattern = re.compile(r'http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+')
k = tag['aria-label']
url = re.findall(pattern,s)[0]
print(k)
print(url.split("/")[-1])
# urllib.request.urlretrieve(url, "./emojis/" + url.split("/")[-1]) //下载逻辑
d[k] = url.split("/")[-1]
print(d)
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。