代码拉取完成,页面将自动刷新
def print_one_hero_soup(one_hero_url):
one_hero_response = requests.get(one_hero_url)
one_hero_response.encoding = one_hero_response.apparent_encoding # 获取网页真实编码 https://www.cnblogs.com/bw13/p/6549248.html
one_hero_html = one_hero_response.text
one_hero_soup = BeautifulSoup(one_hero_html, 'html.parser') # BeautifulSoup 解析网页,获取源代码
return one_hero_soup
def print_one_hero_xpath(one_hero_url):
options = webdriver.ChromeOptions()
options.headless = True # 不弹出 Chrome浏览器界面,后台运行
driver = webdriver.Chrome(chrome_options = options) # 控制chrome浏览器
driver.get(one_hero_url)
time.sleep(2)
content = driver.page_source # selenium 获取网页源代码
cont_xph = lxml.etree.HTML(content) # 解析 content
return cont_xph
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。