avatar

AngYi

Aim for the stars, and beyond.

  • 首页
  • 分类
  • 标签
  • 归档
  • 相册
  • 关于我
Home 数据处理与特征工程
文章

数据处理与特征工程

Posted 2021-10-15 Updated 2023-10- 17
By AngYi
5~6 min read

image-20211015151123680

推荐菜菜的sklearn完整版,价值4999元的最全机器学习

这应该是我找到的最系统,最通俗易懂、实践性最强、教学讲解最好的网络课程,非常适用新手入门和回看复习。这里有部分课件(链接: https://pan.baidu.com/s/1AZ5h_uDKMBpxNvPIeASRBQ 提取码: osw8)

之前一直觉得当一名调包侠不好,直接调包肯定理解不好原理,所以一直拒绝Sklearn包,直到面试的时候才发现自己机器学习原理的欠缺,好多知识和公式并没有真正理解到位。更为致命的是压根不会用,不知道机器学习的流程是啥,有哪些的特征处理方法,哪些特征构造方法等等。

直到看到了菜菜老师的这门机器学习课程,非常系统,在这个自己学习探索阶段能够学到这样系统的课程是多么的幸福,比自己乱七八糟搜索来的知识系统的多!

正好也恶补一下吧。都是要还滴!

image-20211012145229123

数据处理

这部分就不赘述,简单一张图概述。

image-20211011170149135

特征工程

特征工程是利用数据所在领域的相关知识来构建特征,使得机器学习算法发挥其最佳的过程。它是机器学习中的一个基本应用,实现难度大且代价高。采用自动特征工程方法可以省去采用人工特征工程的需求。

Andrew Ng 说“挖掘特征是困难、费时且需要专业知识的事,应用机器学习其实基本上是在做特征工程。”

理解数据是非常重要的。

image-20211011195419431

数据分析
数据处理
License:  CC BY 4.0
Share

Further Reading

Apr 4, 2022

Matplotlib常用布局-代码仓库

Matplotlib常用布局-代码仓库行列组合# 2 行 4 列 fig,ax = plt.subplots(2,4,figsize=(12,18),dpi=250,sharey=True,sharex=False) # 第一行 第一列ax[0][0].plot(spring_result.sub_

Nov 7, 2021

CMIP6 海气耦合模型数据下载

Oct 15, 2021

数据处理与特征工程

推荐菜菜的sklearn完整版,价值4999元的最全机器学习这应该是我找到的最系统,最通俗易懂、实践性最强、教学讲解最好的网络课程,非常适用新手入门和回看复习。这里有部分课件(链接: https://pan.baidu.com/s/1AZ5h_uDKMBpxNvPIeASRBQ 提取码: osw8)

OLDER

常用数据下载方式

NEWER

利用docsify生成文档网站

Recently Updated

  • DeepSeek 创始人梁文峰采访:创新、人才与中国 AI 发展
  • 福州-厦门之行
  • 我有自己的摄影网站啦
  • 借助Ollama一键本地部署CodeGeex,让AI帮你打工
  • Dash 进阶技巧

Trending Tags

ssh linux matlab 感悟 读书 blog git python flask ML

Contents

©2025 AngYi. Some rights reserved.

Using the Halo theme Chirpy