zl程序教程

您现在的位置是:首页 >  工具

当前栏目

【学习总结】GirlsInAI ML-diary day-20-初识 Kaggle

学习 总结 20 初识 ML Day Kaggle diary
2023-09-14 09:00:39 时间

【学习总结】GirlsInAI ML-diary 总

原博github链接-day20

初识kaggle

1-注册一个账号(由于被谷歌收购,因此可能需要梯子)
2-Competition - 学会看一个比赛
3-Titanic - 开启人生中第一个kaggle比赛
4-Data - 学会在kaggle上找到自己要的数据集(有账号才能下载数据)
5-Kernels - 学会看别人的代码
6-Discussion - 学会看别人的思路
7-摆正心态

1-注册一个账号(由于被谷歌收购,因此可能需要梯子)

  • 官网地址:http://www.kaggle.com

  • 好像就是需要梯子,网易邮箱注册收不到验证邮件,直接用谷歌账号登录的。。

2-Competition - 学会看一个比赛

  • 首页最上面的多个标签中点 competition 进入“比赛”

  • 学会看比赛的分类:

Featured:这些通常是由公司、组织甚至政府赞助的,百万美金奖金池不在话下。
Research:这些是研究方向的竞赛,只有很少或没有奖金。它们也有非传统的提交流程。
Recruitment:这些是由想要招聘数据科学家的公司赞助的。目前仍然相对少见。
Getting Started:这些竞赛的结构和 Featured 竞赛类似,但没有奖金。它们有更简单的数据集、大量教程和滚动的提交窗口让你可以随时输入。

  • 初学者点击【Getting Started】。Search】框,可以按自己意愿搜索比赛。

3-Titanic - 开启人生中第一个kaggle比赛

  • 找到这个比赛:搜索框直接搜,或者在初学者的比赛中找到,点进去

  • overview标签显示本比赛的说明,在右侧的“join competition”点击可以报名


4-Data - 学会在kaggle上找到自己要的数据集(有账号才能下载数据)

  • ‘Data’标签:Data Description,看数据中有哪些变量,以及每个变量代表着什么信息。

  • 下载数据:继续往下,可以看到‘download all’的按钮,可以下载数据

5-Kernels - 学会看别人的代码

  • “Kernels”标签:可以浏览和学习别人的代码

6-Discussion - 学会看别人的思路

  • “Discussion”:大家讨论解决思路的地方,有解题的代码,也有散发性的观点,或者吐槽的地方

7-摆正心态

  • Kaggle,数据科学的家园,为竞赛参与者,客户解决方案和招聘求职提供了一个全球性的平台。这是Kaggle的特殊吸引力,它提供的竞赛不仅让你站到不同的高度思考问题,还提供了可观的奖金。

  • 国内外都有很多像kaggle这样的社区/比赛/网站,比如天池等等。很多大厂都开始流行举办机器学习比赛了,里面有数据,比赛,还有百万美元的巨额奖金,of courseclap

  • 然而,人们总是犹豫到底要不要参加竞赛。其中有以下几个原因:

他们小看了自己的技能,知识和掌握的技术的水平。
不管自己一连串技能的水平如何,他们都选择奖金最高的问题。
在问题的困难度水平上,他们没有充分发挥出自己的技能水平。

  • 作为初学者,建议大家抱着玩一玩的心态,别把兴趣磨灭在自我苛刻上,那就太得不偿失了。

作业:

  • 下载本比赛的数据,下节课要用

  • 数据集文件存放在常用文件路径下

END