代码拉取完成,页面将自动刷新
同步操作将从 振长策而御宇内/PythonClimbInsect 强制同步,此操作会覆盖自 Fork 仓库以来所做的任何修改,且无法恢复!!!
确定后同步将在后台操作,完成时将刷新页面,请耐心等待。
# -*- coding:utf8 -*-
import urllib2,re
from bs4 import BeautifulSoup
root = 'http://www.biquge.com/'
urlList = [];
chaptername = raw_input('请输入笔趣阁小说章节目录子地址:')
print u"正在解析章节列表..."
soup = BeautifulSoup(urllib2.urlopen(root+chaptername+u'/').read())
novelname = soup.find('div',id='info').find('h1').get_text()
for result in soup.find(id="list").find("dt").find_next("dt").find_next_siblings("dd"):
res = result.find_next("a")
urlList.append(res['href'])
fileHandle = open(novelname+u'.txt','a')
for result in urlList:
temp = BeautifulSoup(urllib2.urlopen(root+result).read())
#print temp.find(id="content").get_text()
print u"正在下载:"+temp.title.text;
content = temp.find(id="content").get_text().encode('gbk','ignore')
#rstr = r'<(S*?)[^>]*>.*?|<.*? /> '
#fileHandle.write(re.sub(rstr, "", content))
fileHandle.write(content)
fileHandle.close()
print "~~~~~~~~~~~~~~~~~~~~~~~~~~END~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~"
#为了避免双击的时候直接一闪退出,在最后面加了这么一句
raw_input("Press <Enter> To Quit!")
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。