# WeChat_Article **Repository Path**: songxf1024/WeChat_Article ## Basic Information - **Project Name**: WeChat_Article - **Description**: 爬取微信公众号文章 - **Primary Language**: Python - **License**: Apache-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 214 - **Forks**: 91 - **Created**: 2019-02-24 - **Last Updated**: 2025-10-14 ## Categories & Tags **Categories**: spider **Tags**: None ## README # WeChat_Article 爬取微信公众号文章 > Bilibili视频演示:https://www.bilibili.com/video/BV1vN411D7Y3/ **注意,除非你要断点续传,否则删除目录下conf.ini和url.json再启动!!!!** ![image](https://user-images.githubusercontent.com/31002981/217465357-d0737b23-55ec-47d3-b12c-ee8973a04291.png) ## 使用方法: 1、下载[**Chrome.rar**](https://sxf1024.lanzouo.com/iJ2Rp0mwy50j)并解压为**Chrome**; 2、点击页面右上角绿色“**Code**”按钮,再点“**Download Zip**”按钮,解压为**default**; 3、将解压的**Chrome**放到解压的**default**里; 4、进入**default**目录,运行**main.exe**或者**main.py**; 5、填入信息,点击“**启动**”即可。 6、如果想修改UI,可以安装这个:[Qt Designer](https://build-system.fman.io/qt-designer-download) **************************************************************************************************** ## 背景知识: 使用公众号写文章时支持搜索其他公众号的文章的方式,来实现爬取指定公众号所有文章的目的。 **************************************************************************************************** ## 程序原理: 通过selenium登录获取token和cookie,再自动爬取和下载 * 使用前提: 1、申请一个免费的微信公众号,个人订阅号即可(https://mp.weixin.qq.com) **************************************************************************************************** ## 更新记录: 1. 下载文章文字内容到txt 2. 下载文章图片 3. 保存HTML文件,并将图片链接指向本地 4. 添加按时间范围下载 5. 添加cookie登陆,不成功才selenium浏览器登陆 6. 增加记住密码功能 7. 修复一些问题,如requests卡死 8. 添加按关键词下载 9. 多线程优化下载速度 10. 增加断点续传功能(可能存在bug,推荐不要用) 11. 拟增加备用公众号功能(暂未完成) 12. 下载PDF格式 13. 不需要再手动下载Chrome,启动时会自动下载 **************************************************************************************************** ## 使用说明: 创建虚拟环境 ```bash conda create -n wechat python=3.9 -y ``` 进入虚拟环境 ```bash conda activate wechat ``` 安装三方库 ```bash pip install -r requirements.txt ``` > 对于mac用户,安装pyqt5可能会报错,可以尝试: > ```bash > brew install pyqt@5 > cp -r /opt/homebrew/Cellar/pyqt@5/5.15.7_2/lib/python3.9/site-packages/* /Users/songxf/miniconda3/envs/wechat/lib/python3.9/site-packages/ > ``` > 然后就可以导入了: > ```bash > import PyQt5 > ``` 运行脚本 ```bash python main.py ``` 打包exe(生成在dist下) ```bash pyinstaller -F -w -i icon.ico main.py ``` ## 其他说明: - 爬取间隔太快,容易遇到“**访问频繁**”或“**freq_control**”,这时候可以删除**cookie.json**,再重新运行软件,**换个号**继续运行; - Qt打包完实在是太大了,有大佬会转成Tkinter吗? 欢迎关注微信公众号:xfxuezhang # 相关项目 > 感谢大佬们的贡献 ♪(・ω・)ノ - [web版](https://github.com/wechat-article/wechat-article-exporter) - [QT6版](https://github.com/wooodypan/WeChat_Article) --- ## 打赏 如果这个项目帮助到了你,欢迎请我喝杯阔落👏🏻 ![yf](yf.png) ## Star History [![Star History Chart](https://api.star-history.com/svg?repos=1061700625/WeChat_Article&type=Date)](https://www.star-history.com/#1061700625/WeChat_Article&Date)