机器学习和数据科学:机器学习和数据挖掘:回归[线性(选择和收缩,降维,超出线性范围)和非线性回归(逻辑,K-NN,树)],交叉验证(LOOCV,K -折数,偏差与方差,分类(LDA,QDA,K-NN,物流,树,SVM),聚类(PCA,K-Means,分层)本课程将介绍数据挖掘统计学习中的主要主题,包括:统计基础,数据可视化,分类,回归,聚类。 重点将放在统计学习方法,其背后的模型,直觉和假设以及对实际问题的应用上。 您可以在stats 415项目文件夹中找到我的最终项目。 项目摘要实施整个学期学习的所有
文件大小:
18479k
资源说明:机器学习与数据科学
机器学习和数据挖掘:回归[线性(选择和收缩,降维,超出线性范围)和非线性回归(逻辑,K-NN,树)],交叉验证(LOOCV,K折,偏差与方差) ,分类(LDA,QDA,K-NN,物流,树,SVM),聚类(PCA,K-Means,分层)本课程将介绍数据挖掘/统计学习的主要主题,包括:统计基础,数据可视化,分类,回归,聚类。 重点将放在统计学习方法,其背后的模型,直觉和假设以及对实际问题的应用上。 您可以在stats 415项目文件夹中找到我的最终项目。
项目总结
实施整个学期学习的所有分类器,以预测通过BMI分类的美国肥胖率,其中最佳分类器为7倍KNN,预测准确性为81.54% 分析模型选择方法以提供最佳模型并找到最佳预测因子; 结论是可以根据收入,饮食习惯,运动习惯和购物习惯来非参数地预测BMI
本源码包内暂不包含可直接显示的源代码文件,请下载源码包。
English
