使用scrapy框架爬取数据,数据库选用MongoDB和Redis,先爬取知乎上回答过同一类问题的用户群体(代号A)及其粉丝群体(代号B),从B中根据关注A的数量筛选出最佳粉丝群体(代号B+),再从A中根据其在B+中的粉丝数量筛选出最佳用户(代号A+).
最近更新: 3年多前DeepPavlov 是一个开源的对话 AI 库,基于 TensorFlow 和 Keras 构建,其作用是: NLP 和对话系统研究; 实现和评估复杂对话系统
最近更新: 接近4年前抽取关系节点,以neo4j存储到图数据库中,为图中的关系做推荐服务。
最近更新: 接近5年前中文实体关系抽取,pytorch,bilstm+attention
最近更新: 接近5年前Awesome-TensorFlow-Chinese,TensorFlow 中文资源精选,官方网站,安装教程,入门教程,实战项目,学习路径。QQ群:522785813,微信群二维码:
最近更新: 接近5年前实战多种网站、电商数据爬虫。包含:淘宝商品、微信公众号、大众点评、招聘网站、闲鱼、阿里任务、scrapy博客园、微博、百度贴吧、豆瓣电影、包图网、全景网、豆瓣音乐、某省药监局、搜狐新闻、机器学习文本采集、fofa资产采集、汽车之家、国家统计局、百度关键词收录数、蜘蛛泛目录、今日头条、豆瓣影评️...
最近更新: 接近5年前农业知识图谱(KG):农业领域的信息检索,命名实体识别,关系抽取,分类树构建,数据挖掘
最近更新: 接近5年前基于医药知识图谱的智能问答系统
最近更新: 接近5年前