1 Star 0 Fork 0

D.CL/feapder_file

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
main.py 1.27 KB
一键复制 编辑 原始数据 按行查看 历史
D.CL 提交于 2021-12-02 18:20 . 增量爬虫
from spiders import hj_spider, z_spider
from feapder.utils.custom_argparse import ArgumentParser
def hj_spider_test():
hj_spider.HjSpider(redis_key='test:spider').start()
def z_spider_test(args):
spider = z_spider.ZSpider(
redis_key="z_spider:test", # redis中存放任务等信息的根key
task_table="batch_spider_task", # mysql中的任务表
task_keys=["id", "page"], # 需要获取任务表里的字段名,可添加多个
task_state="state", # mysql中任务状态字段
batch_record_table="batch_z_spider_batch_record_1", # mysql中的批次记录表
batch_name="test1", # 批次名字
batch_interval=1/12, # 批次周期 天为单位 若为小时 可写 1 / 24
)
if args == 1:
spider.start_monitor_task() # 下发及监控任务
else:
spider.start() # 采集
# spider.start_monitor_task() # 下发及监控任务
# spider.start() # 采集
if __name__ == "__main__":
parser = ArgumentParser(description="Spider测试")
parser.add_argument(
"--test_spider", action="store_true", help="测试Spider", function=hj_spider_test
)
parser.add_argument(
"--z_spider_test", type=int, nargs=1, help="", function=z_spider_test
)
parser.start()
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
1
https://gitee.com/dcl877830/feapder_file.git
git@gitee.com:dcl877830/feapder_file.git
dcl877830
feapder_file
feapder_file
master

搜索帮助