1 Star 0 Fork 0

WildPointer/WeiboCrawler

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
userrelationextractor.h 1.10 KB
一键复制 编辑 原始数据 按行查看 历史
lee 提交于 2018-02-17 22:22 . 完成v1.0
#ifndef USERRELATIONEXTRACTOR_H
#define USERRELATIONEXTRACTOR_H
#include <userrelation.h>
#include <htmlloader.h>
#include <string>
#include <pageproxy.h>
#include <json/json.h>
#include <boost/format.hpp>
class UserRelationExtractor
{
public:
UserRelationExtractor(std::string const& config_path);
void extract(UserRelation &relation);
void set_page_id(std::string const&);
void set_loader(std::shared_ptr<HtmlLoader> const& loader);
private:
std::shared_ptr<HtmlLoader> _loader;
std::string _page_id;
std::string _page_num_selector;
std::string _follow_list_selector;
std::string _fans_list_selector;
std::string _jq_code;
Json::Value _config;
void _extract_follow(UserRelation &relation);
void _do_extract_uids(std::vector<std::string> &relation, boost::format url_format);
void _extract_a_page_follow(std::vector<std::string> &relation, PageProxy & page);
void _extract_a_page_fans(UserRelation &relation, PageProxy &page);
void _extract_fans(UserRelation& relation);
void _page_import_jquery(PageProxy &page);
};
#endif // USERRELATIONEXTRACTOR_H
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
1
https://gitee.com/ambitiouscat/WeiboCrawler.git
git@gitee.com:ambitiouscat/WeiboCrawler.git
ambitiouscat
WeiboCrawler
WeiboCrawler
master

搜索帮助