删除星选集
,关注此星选集的用户都无法再看到这个星选集的内容。
星选集内的仓库不会被取消 Star。
ALGLIB是一个跨平台数值分析和数据挖掘库,支持多种编程语言(C++,C#,Delphi,VB.NET,Python)和多种操作系统(windows,unix family)。 从官网下载(https://www.alglib.net/download.php)后,上传到仓库。 版本:alglib-3.17.0.cpp.gpl Free Edition ALGLIB特性包括: - 数据分析(分类,回归,统计) - 优化和非线性求解器 - 插值和线性/非线性最小二乘拟合 - 线性代数(直接算法,EVD/SVD),直接和迭代线性求解器 - 快速傅里叶变换和许多其他算法
最近更新: 2年多前1. 对数据做数据探索分析(可参考EDA_BikeSharing.ipynb,不计分) 2. 适当的特征工程(可参考FE_BikeSharing.ipynb,不计分) 3. 对全体数据,随机选择其中80%做训练数据,剩下20%为测试数据,评价指标为RMSE。(10分) 4. 用训练数据训练最小二乘线性回归模型(20分)、岭回归模型、Lasso模型,其中岭回归模型(30分)和Lasso模型(30分),注意岭回归模型和Lasso模型的正则超参数调优。 5. 比较用上述三种模型得到的各特征的系数,以及各模型在测试集上的性能。并简单说明原因。(10分)
最近更新: 5年多前二、作业要求: 1.对数据做数据探索分析(可参考0_EDA_ diabetes.ipynb,不计分) 2.适当的特征工程(可参考1_FE_ diabetes.ipynb,不计分) 3.采用5折交叉验证,分别用log似然损失和正确率,对Logistic回归模型的正则超参数调优。(各50分)
最近更新: 6年前探究主播人气影响因素——代码部分: 1. 数据获取(爬取虎牙5W+条数据,此代码不公开) 2. 数据诊断 3. 数据处理(缺失值/异常值处理、LDA主题聚类) 3. 数据分析(建立多元线性回归模型)
最近更新: 3年前1. 对数据做数据探索分析 2. 适当的特征工程 3. 对全体数据,随机选择其中80%做训练数据,剩下20%为测试数据,评价指标为RMSE。 4. 用训练数据训练最小二乘线性回归模型、岭回归模型、Lasso模型,其中岭回归模型和Lasso模型,注意岭回归模型和Lasso模型的正则超参数调优。 5. 比较用上述三种模型得到的各特征的系数,以及各模型在测试集上的性能。并简单说明原因。
最近更新: 5年多前Sklearn机器学习中的主要算法原理以及实现(线性回归、逻辑回归、朴素贝叶斯、K-Means聚类、KNN、PCA主成分分析、BP神经网络)
最近更新: 4年前新冠病毒疫情的爆发,使得中国经济暂时出现了“断点”,在这种突发性、不可预见的自然外部冲击下如何研究疫情对政府治理、经济发展以及人民社会生活等诸多影响将是未来无法逃避的课题。我们为武汉祈祷,为战“疫”在全国各地的医护人员祈祷之余,我们还需要用科学的方式去思考未来。正如Angrist& Pischke所言,在一个高度依赖规则的世界里,有些规则的出现十分随意,这种随意性为我们提供了性质良好的实验,而断点回归设计(Regression Discontinuity Design)是一种仅次于随机实验、能够有效利用现实约束条件分析变量之间因果关系的实证方法。 本讲在第四讲面板数据分享的基础上,对断点回归的基本原理、操作步骤、注意事项等展开详细介绍,并通过对高质量研究论文的复制,讲述断点回归的“套路”,另外附赠三个“彩蛋”,敬请期待! 最后我们期待疫情的拐点尽快出现,疫情可以有拐点,备战决不能有“断点”,明天19点我们一起备战“断点”!
最近更新: 接近5年前
删除星选集
,关注此星选集的用户都无法再看到这个星选集的内容。
星选集内的仓库不会被取消 Star。
取消公开星选集 ,关注此星选集的用户都无法再看到这个星选集的内容。
移出后,此仓库不会被取消Star。