1 Star 0 Fork 0

lee/aiqiyi

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
predictPer.py 1.41 KB
一键复制 编辑 原始数据 按行查看 历史
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error
# 加载数据
data = pd.read_csv("data.csv")
# 数据预处理,选择特征
features = ['tag', 'creator', 'contributor', 'title', 'year', 'month', 'bossStatus', 'hot_score']
X = data[features].fillna(data['hot_score'].mean())
y = data['score_per'].fillna(data['score_per'].mean())
# 对类别特征进行独热编码
X = pd.get_dummies(X)
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 创建线性回归模型
model = LinearRegression()
# 训练模型
model.fit(X_train, y_train)
# 预测
y_pred = model.predict(X_test)
print(y_pred)
sample = {'tag': '都市;爱情;剧情;生活;当代;内地',
'creator': '王 欢',
'contributor': "'江疏影', '杨采钰', '张佳宁', '张慧雯', '李浩菲'",
'title': '唐人街探案2',
'year': 2024,
'month': 3,
'bossStatus': 'FREE',
'hot_score': 6008}
# 将单个样本转换为DataFrame
sample_df = pd.DataFrame([sample])
# 对特征进行预处理,例如独热编码
sample_df = pd.get_dummies(sample_df)
print(sample_df)
print(model.predict(sample_df), "结果")
# 计算均方误差
mse = mean_squared_error(y_test, y_pred)
print("Mean Squared Error:", mse)
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
1
https://gitee.com/lee176/aiqiyi.git
git@gitee.com:lee176/aiqiyi.git
lee176
aiqiyi
aiqiyi
master

搜索帮助