数据处理与特征工程
推荐菜菜的sklearn完整版,价值4999元的最全机器学习
这应该是我找到的最系统,最通俗易懂、实践性最强、教学讲解最好的网络课程,非常适用新手入门和回看复习。这里有部分课件(链接: https://pan.baidu.com/s/1AZ5h_uDKMBpxNvPIeASRBQ 提取码: osw8)
之前一直觉得当一名调包侠不好,直接调包肯定理解不好原理,所以一直拒绝Sklearn包,直到面试的时候才发现自己机器学习原理的欠缺,好多知识和公式并没有真正理解到位。更为致命的是压根不会用,不知道机器学习的流程是啥,有哪些的特征处理方法,哪些特征构造方法等等。
直到看到了菜菜老师的这门机器学习课程,非常系统,在这个自己学习探索阶段能够学到这样系统的课程是多么的幸福,比自己乱七八糟搜索来的知识系统的多!
正好也恶补一下吧。都是要还滴!
数据处理
这部分就不赘述,简单一张图概述。
特征工程
特征工程是利用数据所在领域的相关知识来构建特征,使得机器学习算法发挥其最佳的过程。它是机器学习中的一个基本应用,实现难度大且代价高。采用自动特征工程方法可以省去采用人工特征工程的需求。
Andrew Ng 说“挖掘特征是困难、费时且需要专业知识的事,应用机器学习其实基本上是在做特征工程。”
理解数据是非常重要的。
License:
CC BY 4.0