Skip to content

Kaggle 入门操作指南

注册

  1. 首先注册账号
  2. 关联 GitHub 账号

竞赛 - competitions

选择 版本框架 和 star 最高的 Kernels 编辑就行,然后模仿 数字识别 案例更新

项目规范(以:DigitRecognizer 为例)

文档:结尾文件名为项目名.md

  • 案例:competitions/getting-started/digit-recognizer.md
  • 例如:数字识别,文档是属于 competitions -> GettingStarted 下面,所以创建 competitions/getting-started 存放文档就行

图片:结尾文件名可自由定义

  • 案例:static/images/comprtitions/getting-started/digit-recognizer/front_page.png
  • 例如:数字识别,图片是属于 competitions -> GettingStarted -> DigitRecognizer 下面,所以创建 competitions/getting-started/digit-recognizer 存放文档的图片就行

代码:结尾文件名可自由定义.py

  • 案例:src/py3.x/kaggle/getting-started/digit-recognizer/dr_knn_pandas.py
  • 例如:数字识别,代码只有 竞赛 有,所以直接创建 getting-started/digit-recognizer 存放代码就行
  • 要求(方法:完全解耦)
    1. 加载数据
    2. 预处理数据(可没)
    3. 训练模型
    4. 评估模型(可没)
    5. 导出数据
  • 标注python和编码格式
#!/usr/bin/python
# coding: utf-8
  • 标注项目的描述
'''
Created on 2017-10-26
Update  on 2017-10-26
Author: 【如果是个人】片刻
Team:   【如果是团队】装逼从不退缩(张三、李四 等等)
Github: https://github.com/apachecn/Interview
'''

数据:结尾文件名可自由定义

  • 输入:datasets/getting-started/digit-recognizer/input/train.csv
  • 输出:datasets/getting-started/digit-recognizer/ouput/Result_sklearn_knn.csv
  • 例如:数字识别,数据只有 竞赛 有,所以直接创建 getting-started/digit-recognizer 存放数据就行

结果提交

将数据的输出结果提交到项目的页面中

docs目录(可忽略)

docs 目录存放的是 ApacheCN 整理的操作or说明文档,和 kaggle 网站内容没有关系

后面会持续更新


我们一直在努力

apachecn/AiLearning

【布客】中文翻译组