# program **Repository Path**: walkerzj/program ## Basic Information - **Project Name**: program - **Description**: No description available - **Primary Language**: Python - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2019-06-10 - **Last Updated**: 2020-12-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README ### program(program中的程序都迁移到了paper_program中,program中的代码仅供参考,具体实现在paper_program中) 实现代码在program中的每个模块中都有详细介绍,这部分代码是论文实验代码。分为数据获取,数据预处理,性别预测几个模块,详情看代码中有详细介绍 #### 以下的代码讲的是之前aminer接口还能够调用的时候的代码,放在data_mining里面,仅供参考, 以下为学术数据研究相关的代码模块 #### env: python3 #### soft: 数据库:mongodb(存储学术数据),redis(维护ip代理池) 编辑器: Atom ### trash是不用的代码,具体代码存放于data_mining下 #### collaboration_dataset 对学术数据进行预处理,主要提取所有论文的作者信息和所有论文涉及到的领域信息 #### gender_prediction 1、使用aminer中gender_prediction(https://www.aminer.cn/gender)算法实现对论文作者性别的判断 2、需要VPN(因为需要使用到google图像,google搜索) 3、需要face++接口凭证(https://www.faceplusplus.com/) #### get_aminer_data_two 原先aminer接口还好的时候调用其接口(https://www.aminer.cn/gender/api)的方法,现在在gender_prediction中实现了该算法 #### get_how_many_papers 不用的代码片段,里面包含了怎么使用代理服务,使用redis维护代理池 #### get_micro_data_two 调用micro接口获取到研究所需要的所有学术信息,这也需要micro接口凭证(https://docs.microsoft.com/en-us/azure/cognitive-services/academic-knowledge/paperentityattributes),接口文档(https://dev.labs.cognitive.microsoft.com/docs/services/56332331778daf02acc0a50b/operations/565d9001ca73072048922d97) #### get_field_name 爬取微软学术中所出现的各个领域名称,用于分析男女在不同领域的研究情况