python爬取数据,将得到的数据进行数据清洗,最后将数据可视化
python爬取数据,将得到的数据进行数据清洗,最后将数据可视化
1.数据来源:贝壳网广州已成交的二手房数据 2.数据采集:使用Python的Request爬取原数据,使用BeautifulSoup解析数据,使用header模拟浏览器发起请求,绕过反爬机制,使用cookie保持登录状态 3.数据清洗:使用python清洗空值,Notepad清洗异常值以及格式化数据 4.数据分析:使用hive进行数据分析 5.数据可视化:使用Flask框架+echarts库可视化
最近一年贡献:0 次
最长连续贡献:0 日
最近连续贡献:0 日
贡献度的统计数据包括代码提交、创建任务 / Pull Request、合并 Pull Request,其中代码提交的次数需本地配置的 git 邮箱是 Gitee 帐号已确认绑定的才会被统计。