公司在雇用他们时如何知道哪个数据科学家更出色?如何展示自己的才能并在社区中成名?评级的依据是什么,然后您就可以根据这个职位被聘用为有名望的职位?我们将向您介绍最著名的竞争平台,其游戏的可能性和规则,并向您介绍来自俄罗斯的最佳参与者。
从定义上讲,数据科学是一门科学。因此,为了评估开发人员和分析人员,在科学家中广泛使用的Hirsch指数已经应用了很长时间了 。通过出版物的数量及其引用,它有助于了解需要多少科学工作,从而了解其作者。
Hirsch指数h等于文章数,每篇文章至少引用h次。也就是说,为了进行计算,他们将其同事引用的科学家的所有文章,按引用编号的降序排列,并分配编号。在那之后,他们找到了最后一篇文章,其数量不超过被引用的数量。此数字是Hirsch索引。复杂?看起来还不太好,而且真实的数据科学家会立即了解-只是不太适合评估他们的工作。毕竟,他们工作的结果通常更多是代码,而不是科学文本。此外,市场上对数据科学家的需求很大,算法实例比市场对科学的成就更重要。
但是,公司通常会将有关其员工及其工作的信息保密。数据科学家们特别精心地藏在俄罗斯, 有一个 人在这方面的巨大不足。
为了响应需求,面向开发人员的竞争性平台日益流行。最著名的服务是由Google拥有的Kaggle(发音为“ cajl”)。学生使用 它,专业开发人员 告诉如何升级您的评分。那里采用的解决方案在数据科学家中树立了时尚,俄罗斯和世界各地的公司在招聘时都关注他们在Kaggle评级中的位置。
在2017年, 有超过一百万的用户在Kaggle 注册,并且在2020年8月,来自俄罗斯的用户使用 该 服务搜索Google的频率几乎与“大数据”这个短语相同:
Kaggle是完全免费的,任何用户都可以主持数据挖掘竞赛或参加现有竞赛。该系统托管开放数据集 ,并提供用于其处理和机器学习的云工具。还有一个学习的机会和一个职位空缺发布部分,比赛也可以帮助选择最佳候选人。
这个怎么运作
评分系统 是Kaggle有趣的功能之一,由于它在数据科学环境中变得如此流行,因此值得一看 。
用户可以在以下四个不同类别中获得积分并提高排名:
- 竞争。 您可以单独或作为一个团队来解决机器学习问题。比赛种类繁多:从简单而直接的任务来预测 泰坦尼克号上的幸存者数量, 到 评估 从2021年NFL大数据碗传球而来的防守球员的效率。
- 程序代码。 通过在云计算环境Kaggle Notebooks上运行与社区共享您的代码。
- 数据集。 您可以通过共享新数据来帮助其他数据科学家。
- 讨论。 讨论任务并分享最佳解决方案,并对其他用户的帖子进行评分。
每个类别中的晋升都不依赖于其他类别。其中提供了不同级别的成就:
- 初学者。 您只需要注册。
- 参加者 您填写了个人资料并与社区进行了交谈,还使用了平台的所有功能:
-运行一个脚本。
-我们参加了一场比赛。
-我们写了一条评论。
-我们对其中一位参与者投了一票。
- . Kaggle . , Kaggle .
- . , Kaggle . «» , .
- . . .
奖牌是在比赛中获得优异成绩,流行的程序代码或有用的数据集而颁发的,并会永久保留。同时,积分会随着时间的流逝而失去价值,从而使总体排名保持相关性。
谁先来?
最重要的是Kaggle的 注册 用户来自印度和美国。俄罗斯在中国和日本之间的国家总体排名中保持稳定的第五位。 在总排名的第一位数据的 科学比赛 采取的是Guanshuo许,来自纽约的科学家的数据。五年来,他在Kaggle比赛中得分超过25.5万(这是绝对记录)。
光硕 完了 先后获得上海同济大学电气和电子工程学士学位,然后在新泽西大学获得硕士学位。自2010年以来,他一直致力于图像识别和机器学习算法,2017年他首次成为Kaggle的大师,自2019年以来,他一直担任H2O.ai的数据科学家(思科,英特尔和PayPal使用该公司的算法)。
Kaggle称赞俄罗斯最好的数据科学家
为了汇总俄罗斯最佳实践数据科学家的名单,我们使用 了Kaggle比赛参与者的 数据,这些参与者拥有个人信息。 参加Kaggle竞赛Dmitry Gordeev (dott)
的最强大的俄罗斯开发商 也在H2O.ai工作。他八年前与Kaggle签约,今天获得114,000分。 在Kaggle的总体排名中,他 排名第九
... Dmitry于2010年毕业于莫斯科国立大学,在那里进行图像识别和数据挖掘。自2008年以来,他在一家银行的零售风险建模小组工作,现已成长为部门总监,并于2013年移居奥地利。 2014年,他完成了Coursera上的数据科学课程,并于2020年加入了 H2O.ai团队。
在 Kaggle竞赛的俄罗斯数据科学家中排名第二的是Arthur Kuzin(n01z3),在Kaggle的总体排名中排名第28位,得分超过71000分。
Arthur于2011年毕业于莫斯科物理技术学院,并于2008年至2016年从事研究分析工作。之后,他在Avito担任数据科学家的工作,并且在过去几年中一直领导X5 Retail Group的Computer Vision团队。亚瑟(Arthur)拥有 几本 物理出版物,并拥有用于校准透射电子显微镜的设备的专利。 俄罗斯人Kaggle比赛整体排名中
的第三名是Artem Kulakov(Art)-在总体排名中,他获得了第29位和7.1万个Kaggle积分,这是他在两年的比赛中赢得的。 Artem在高等经济学院学习计算机科学学位,并且已经在Tinkoff Bank和Megafon担任数据分析师。 Artem现在正在从事计算机视觉和NLP任务的自由职业。
第四名是Roman Soloviev(ZFTurbo)-他获得69千分,在Kaggle比赛的整体排名中排名第31位。罗曼(Roman)是俄罗斯科学院微电子设计问题研究所的首席研究员。
第五名是 Ilya Larchenko(ilialar),目前在Kaggle总体排名中排名第37,得分为65k。 Ilya于2014年毕业于莫斯科物理技术学院,之后担任分析师和开发人员。自2017年以来,他 领导 DOC +的数据科学家团队,并于2020年移居泰国,在Agoda担任数据科学经理。
允许用户在Kaggle比赛中获得积分和奖章的游戏化这一小要素改变了招聘游戏。
俄罗斯最好的数据科学家的例子表明,使用数据的教育和经验对于建立成功的职业并不那么重要。例如,阿特姆·库拉科夫(Artem Kulakov)仍在大学学习,两年前他才开始在Kaggle参加比赛。现在,他是俄罗斯最好的数据科学家之一,并且是自由职业者。徐光硕毕业于电气和电子工程学士学位,现在在开源数据科学解决方案领导者H2O.ai工作。
从今天的简单任务开始-谁会知道,也许在一两年之内,您将跻身最佳数据科学家的行列,并不断取得进步,实施HIV研究技术 ,预测高速公路拥堵的模型 以及更多。最主要的是渴望在数据科学领域发展并尽可能多地实践。
更多课程