1 Star 14 Fork 2

三千xc/基于python的网络爬虫-猫眼top100实践

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
wordCloud.py 1.10 KB
一键复制 编辑 原始数据 按行查看 历史
三千xc 提交于 2021-01-02 21:27 . flask
# -*- codeing =utf-8 -*-
# @Time : 2020/12/14 21:05
# @Author : 三千xc
# @File : wordCloud.py
# @Software: PyCharm
#分词
import jieba
#绘图,数据可视化
from matplotlib import pyplot as plt
#词云
from wordcloud import WordCloud
#图片处理
from PIL import Image
#矩阵运算
import numpy as np
#数据库
import sqlite3
#准备词云所需的文字
con = sqlite3.connect('movie.db')
cur = con.cursor()
sql = 'select instroduction from movie250'
data = cur.execute(sql)
text = ""
for item in data:
text = text + item[0]
# print(item[0])
cur.close()
con.close()
#分词
cut = jieba.cut(text)
string = ' '.join(cut)
# print(len(string))
#打开遮罩图片
img = Image.open(r'.\static\images\spiderman.jpg')
# 将图片转换为数组
img_array = np.array(img)
wc = WordCloud(
background_color='white',
mask = img_array,
font_path="MFQingShu_Noncommercial-Regular.otf"
)
wc.generate_from_text(string)
#绘制图片
fig = plt.figure(1)
plt.imshow(wc)
plt.axis('off')
# plt.show()
plt.savefig(r'.\static\images\word.jpg')
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
Python
1
https://gitee.com/bilibili-44784041/python_project.git
git@gitee.com:bilibili-44784041/python_project.git
bilibili-44784041
python_project
基于python的网络爬虫-猫眼top100实践
master

搜索帮助