Skip to content

Mercari 价格建议挑战赛

你能自动建议网上卖家的产品价格?

比赛说明

可能很难知道有多少东西是真正值得的。小细节可能意味着定价的巨大差异。例如,这些毛衫中的一件成本为335美元,另一件成本为9.99美元。你能猜出哪一个是哪个?

考虑到网上销售的产品有多少,产品定价的难度就更大了。服装具有强劲的季节性价格趋势,受品牌影响很大,而电子产品则根据产品规格波动。

日本最大的社区购物应用程序Mercari深知这个问题。他们想为卖家提供定价建议,但是这样做很困难,因为卖家可以在Mercari的市场上投入任何东西或任何东西。

在这场比赛中,Mercari挑战你建立一个算法,自动建议正确的产品价格。您将获得用户输入的产品文本说明,包括产品类别名称,品牌名称和项目条件等详细信息。

请注意,由于这些数据的公共性质,这个竞赛是一个“Kernels Only”竞赛。在挑战的第二阶段,文件只能通过内核获得,并且您将无法修改您的方法来响应新数据。在 数据选项卡内核常见问题页面 阅读更多详细信息。

注意:项目规范

成员角色

角色 用户 QQ GitHub 负责内容 进度
发起人 片刻 529815144 https://github.com/jiangzhonglian 负责整个项目推进 5%
负责人
1.目标定义
昵称 xxx-可以选择匿名 负责某个业务理解和指标确认
参与人
1.目标定义
昵称 xxx-可以选择匿名 负责某个业务理解和指标确认
xx人
2.数据采集
昵称 xxx-可以选择匿名 负责
参与人
3.数据整理
佳乐 872520333 负责(助手)
参与人
3.数据整理
诺木人 498744838 https://github.com/1mrliu 负责(助手)
xx人
4.构建模型
昵称 xxx-可以选择匿名 负责
参与人
4.构建模型
/ 610395649 https://github.com/lai-bluejay 负责(助手)
xx人
5.模型评估
昵称 xxx-可以选择匿名 负责
参与人
5.模型评估
/ 610395649 https://github.com/lai-bluejay 负责(助手)  
xx人
6.模型发布
昵称 xxx-可以选择匿名 负责

1.目标定义

  • 任务理解
  • 指标确定

2.数据采集

  • 建模抽样
  • 质量把控

3.数据整理

  • 数据探索
  • 数据清洗
  • 数据集成
  • 数据变换
  • 数据规约

4.构建模型

  • 模式发现
  • 构建模型
  • 验证模型

5.模型评估

设定评估指标

1.绝对误差于相对误差

2.平均绝对误差

3.均方误差

4.均方根误差

5.平均绝对百分误差

6.Kappa统计

7.识别准确度(正确率)

8.识别精确度( P值 )

9.反馈率( R值 )

10.非均衡问题( F值 )

11.ROC曲线/AUC面积

12.混淆矩阵

  • 多模型对比
  • 模型优化

6.模型发布

  • 模型部署
  • 模型重构

我们一直在努力

apachecn/AiLearning

【布客】中文翻译组