2 Star 0 Fork 187

prey/Python爬虫

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
文件
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
爬取瓜子二手车(添加爬取车辆图片功能).py 1.10 KB
一键复制 编辑 原始数据 按行查看 历史
import requests
from selenium import webdriver
from pyquery import PyQuery as pq
import pymongo
from bs4 import BeautifulSoup
clien=pymongo.MongoClient(host='改成自己的数据库IP')
db=clien.Used_car
coll=db.The_car
headers={
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36 SE 2.X MetaSr 1.0'
}
def A_used_car(page):
Url='https://www.guazi.com/gl/buy/o%s/#bread'%page
brow=webdriver.Chrome()
brow.get(Url)
Web_content=brow.page_source
doc=pq(Web_content)
content=doc('.car-a').items()
for i in content:
#cute=pq(i.find('.t').html()).text()
#print(cute)
#print(i.find('.car-a').attr('title'))
data={
'车名字':i.attr('title'),
'年数和里程数':i.find('.t-i').text().replace('\n',''),
'价格':i.find('.line-through').text(),
'车的照片':pq(i.html()).find('img').attr('src')
}
print(data)
#coll.insert_one(data)
brow.close()
for i in range(1,65):
A_used_car(i)
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
Python
1
https://gitee.com/li-zhixinhh/python_reptilian.git
git@gitee.com:li-zhixinhh/python_reptilian.git
li-zhixinhh
python_reptilian
Python爬虫
master

搜索帮助

0d507c66 1850385 C8b1a773 1850385