代码拉取完成,页面将自动刷新
同步操作将从 乾坤盒子/MongooCrawler 强制同步,此操作会覆盖自 Fork 仓库以来所做的任何修改,且无法恢复!!!
确定后同步将在后台操作,完成时将刷新页面,请耐心等待。
<?xml version="1.0" encoding="UTF-8"?>
<config>
<mode value="0">
<server port="8889"></server>
</mode>
<datasources>
<datasource name="mysql" class="com.trytech.mongoocrawler.server.common.db.MySqlDruidDataSource">
<property name="driverClassName" value="com.mysql.jdbc.Driver"/>
<property name="url"
value="jdbc:mysql://:3306/crawler?useUnicode=true&characterEncoding=utf8&zeroDateTimeBehavior=round"/>
<property name="username" value=""/>
<property name="password" value=""/>
<property name="maxActive" value="20"/>
<property name="initialSize" value="5"/>
<property name="testOnBorrow" value="true"/>
</datasource>
</datasources>
<crawler>
<!-- 爬虫的名字 -->
<name>LianJiaCrawler</name>
<!-- 起始url -->
<starturl>https://cd.lianjia.com/ershoufang/rs/</starturl>
<runmode>3</runmode>
<!-- 获取每个url的超时时间 -->
<fetchtimeout>3000</fetchtimeout>
<!-- url的存储方式 -->
<urlstoremode>LOCAL</urlstoremode>
<!-- 必须继承自com.trytech.mongoocrawler.client.parser.HtmlParser -->
<firstparser class="com.trytech.mongoocrawler.server.parser.lianjia.LianjiaHtmlParser"></firstparser>
<!-- 存储器 -->
<pipeline class="com.trytech.mongoocrawler.server.pipeline.LianjiaPipline"></pipeline>
</crawler>
</config>
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。