代码拉取完成,页面将自动刷新
import jieba #分词:句子-->很多的词
from matplotlib import pyplot as plt #绘图,数据可视化
from wordcloud import WordCloud #词云
from PIL import Image #图片处理
import numpy as np #矩阵运算
import sqlite3 #数据库
#准备词云所使用的文字(词)
con=sqlite3.connect('movie.db')
cur=con.cursor()
sql='select instroduction from movie250'
data=cur.execute(sql)
text=""
for item in data:
text=text+item[0]
#print(item[0])
#print(text)
cur.close
con.close
#分词
text_list =[]
cut=jieba.cut(text)
for item in cut:
if(len(item)>1):
text_list.append(item)
string=' '.join(text_list)
print(string)
print(len(string))
img=Image.open(r'.\tree.jpg') #打开遮罩图片
img_array=np.array(img) #将图片转换成数组
wc=WordCloud(
background_color='white', #输出背景颜色
mask=img_array, #遮罩图片数组
font_path="msyh.ttc" #字体所在位置C:\Windows\Fonts
)
wc.generate_from_text(string)
#绘制图片
fig=plt.figure(1)
plt.imshow(wc)
plt.axis('off') #是否显示坐标轴
#plt.show() #显示生成的词云文件
#输出词云图片到文件
plt.savefig(r'.\word.jpg',dpi=500)
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。