1 Star 0 Fork 64

chenglu/MongooCrawler

forked from 乾坤盒子/MongooCrawler 
加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
克隆/下载
config.xml 1.47 KB
一键复制 编辑 原始数据 按行查看 历史
Collin_Chiang 提交于 2018-09-17 01:33 . 监控端第一版已开发完
<?xml version="1.0" encoding="UTF-8"?>
<config>
<mode value="0">
<server port="8889"></server>
</mode>
<datasources>
<datasource name="mysql" class="com.trytech.mongoocrawler.server.common.db.MySqlDruidDataSource">
<property name="driverClassName" value="com.mysql.jdbc.Driver"/>
<property name="url"
value="jdbc:mysql://:3306/crawler?useUnicode=true&amp;characterEncoding=utf8&amp;zeroDateTimeBehavior=round"/>
<property name="username" value=""/>
<property name="password" value=""/>
<property name="maxActive" value="20"/>
<property name="initialSize" value="5"/>
<property name="testOnBorrow" value="true"/>
</datasource>
</datasources>
<crawler>
<!-- 爬虫的名字 -->
<name>LianJiaCrawler</name>
<!-- 起始url -->
<starturl>https://cd.lianjia.com/ershoufang/rs/</starturl>
<runmode>3</runmode>
<!-- 获取每个url的超时时间 -->
<fetchtimeout>3000</fetchtimeout>
<!-- url的存储方式 -->
<urlstoremode>LOCAL</urlstoremode>
<!-- 必须继承自com.trytech.mongoocrawler.client.parser.HtmlParser -->
<firstparser class="com.trytech.mongoocrawler.server.parser.lianjia.LianjiaHtmlParser"></firstparser>
<!-- 存储器 -->
<pipeline class="com.trytech.mongoocrawler.server.pipeline.LianjiaPipline"></pipeline>
</crawler>
</config>
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
Java
1
https://gitee.com/cheng_lu/MongooCrawler.git
git@gitee.com:cheng_lu/MongooCrawler.git
cheng_lu
MongooCrawler
MongooCrawler
master

搜索帮助

D67c1975 1850385 1daf7b77 1850385