1 Star 0 Fork 43

wenxuefeng/go_sexy

forked from 烈冰/go_sexy 
加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
文件
克隆/下载
config.json 1.18 KB
一键复制 编辑 原始数据 按行查看 历史
烈冰 提交于 2018-01-13 22:26 . 增加日志功能
{
"root":"zhaifuli.info",
"proxy":{
"server":"127.0.0.1:1080", /*SOCKS5代理服务器,如果设置成空字符串则不使用代理 127.0.0.1:1080*/
"username":"",
"password":""
},
"header":{/*http请求头*/
"Host":"zhaifuli.info",
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/62.0.3202.94 Safari/537.36",
"Referer": "http://zhaifuli.info/zaqizaba/2407.html"
},
"charset":"gbk", /*可选值utf-8或gbk*/
"regex":{
"page":[], /*正则表达式,只有符合的页面才会被抓取并解析,空白表示所有页面都抓取*/
"imgInPage":["\S+\d+\.html"], /*存放正则,指定图片存在于哪些页面*/
"href":[ /*匹配页面上的链接*/
{
"query":"a", /*存放链接的dom选择器*/
"attr":"href"
}
],
"image":[ /*匹配页面上的图片地址*/
{
"query":"article.article-content img", /*匹配图片的dom选择器*/
"attr":"src", /*指定图片地址再正则表达式里的哪个分组,0表示整个表达式匹配的内容,1表示第一个分组*/
"folder":"none" /*存放图片的文件夹,可选值url,title,none,正则表达式,文件夹名称*/
}
]
}
}
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
Go
1
https://gitee.com/wen_xue_feng/go_sexy.git
git@gitee.com:wen_xue_feng/go_sexy.git
wen_xue_feng
go_sexy
go_sexy
master

搜索帮助