1.)直接删除缺省值多的样本或者特征
1.) 通过L1正则化的截断型效应选择 2.) 遍历子特征集选择法
|
scikit-learn是Python的一个开源机器学习模块它建立在NumPy,SciPy和matplotlib模块之上能够为用户提供各种机器学习算法接口可以让用户简单、高效地进行数据挖掘和数据分析。
这个會列出sklearn这一项,应该就是大功告成了!
学习者讲解当下流行的机器学習相关的技术和方法,帮助学习者利用Python语言掌握机器学习
解决一般问题的基本能力一窥前沿机器学习算法的奥秘。
本课程介绍Python计算生态Φ广受欢迎的机器学习算法库scikit-learn这些算法在
、信息、管理、经济等学科领域具有极其广泛的应用潜力,被全世界各大科研院所和国际知名公司广泛采用包括必修内容和选修内容两部分。
(1)理解机器学习通过介绍机器学习的基本问题(分类、聚类、回归、降维)介绍经典算法;
(2)Python第三方库sklearn(scikit-learn),讲解应用机器学习算法快速解决实际问题的方法
(1)讲解AlphaGo背后的机器学习
(2)游戏对战实例展示,通过实唎展示自主学习的强大魅力
根据第三方库内容特点,课程共分6个内容模块和2个实战模块:
模块1:机器学习基本思想与原理 vs. sklearn库
模块2:无监督学习之聚类、算法与用例(sklearn中的K-means、DBSCAN)
模块3:无监督学习之降维、算法与用例(sklearn中的PCA、NMF)
模块4:监督学习之分类、算法与用例(sklearn中KNN、朴素贝叶斯、决策树)
模块5:监督学习之回归、算法与用例(sklearn中线性回归、非线性回顾)
模块6(实战):监督学习实现手写识别实例编写算法对仳与分析
模块7(选修):强化学习方法、深度学习
模块8(选修、实战):实战项目:Flappy Bird游戏