Skip to content

Kaggle 官方教程:机器学习中级1 课程介绍

原文:Intermediate Machine Learning > Introduction

译者:Leytton

协议:CC BY-NC-SA 4.0

PS:水平有限,欢迎交流指正([email protected]

1、课程介绍

欢迎来到Kaggle Learning《机器学习中级》微课程!

如果你有一些机器学习的基础,并且你想学习如何快速提高模型的质量,那么你就来对地方了!在这个微型课程中,你将学习如何:

  • 处理现实数据集中常见的数据类型(缺失的值、分类变量),
  • 设计pipelines来提高机器学习代码的质量,
  • 使用先进的技术进行模型验证(交叉验证),
  • 建立最先进的模型,广泛用于赢得Kaggle比赛(XGBoost),和
  • 避免常见和重要的数据科学错误(泄漏)。

在此过程中,你将通过使用各个新主题的真实数据完成实际操作来巩固你的知识。实际操作数据来自于赛题 Housing Prices Competition for Kaggle Learn Users, 你将使用79个不同的统计变量(如屋顶类型、卧室数量和浴室数量)来预测房价。通过提交预测结果,观察你在排行榜上的名次上升!

在这里插入图片描述

2、先决条件

如果你以前构建过机器学习模型,并且熟悉模型验证、欠拟合和过拟合以及随机森林等主题,那么你已经为这门微型课程做好了准备。

如果你对机器学习完全陌生,请学习我们的微课程《机器学习入门》,它涵盖了机器学习的基础知识。

3、去吧,皮卡丘

继续第一个练习,学习如何向Kaggle竞赛提交预测结果,并确定在开始之前可能需要检查的内容。



回到顶部