代码拉取完成,页面将自动刷新
同步操作将从 Charles3000/Movie-QA-System 强制同步,此操作会覆盖自 Fork 仓库以来所做的任何修改,且无法恢复!!!
确定后同步将在后台操作,完成时将刷新页面,请耐心等待。
#-*- coding: UTF-8 -*-
#对问题进行分类
from sklearn.naive_bayes import MultinomialNB
from sklearn.feature_extraction.text import TfidfVectorizer
import jieba
class Question_classify():
def __init__(self):
# 读取训练数据
self.train_x,self.train_y=self.read_train_data()
# 训练模型
self.model=self.train_model_NB()
# 获取训练数据
def read_train_data(self):
train_x=[]
train_y=[]
# 读取文件内容
with(open("./questions/label.txt", "r", encoding="utf-8")) as fr:
lines = fr.readlines()
for one_line in lines:
temp = one_line.split(' ')
#print(temp)
word_list=list(jieba.cut(str(temp[1]).strip()))
# 将这一行加入结果集
train_x.append(" ".join(word_list))
train_y.append(temp[0])
return train_x,train_y
# 训练并测试模型-NB
def train_model_NB(self):
X_train, y_train = self.train_x, self.train_y
self.tv = TfidfVectorizer()
train_data = self.tv.fit_transform(X_train).toarray()
clf = MultinomialNB(alpha=0.01)
clf.fit(train_data, y_train)
return clf
# 预测
def predict(self,question):
question=[" ".join(list(jieba.cut(question)))]
test_data=self.tv.transform(question).toarray()
y_predict = self.model.predict(test_data)[0]
print("questions type:",y_predict)
return int(y_predict)
if __name__ == '__main__':
qc=Question_classify()
qc.predict("暗道上映时间")
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。