ML的应用来自哪里?

前言



你好!



标题中的问题不是花言巧语,我真的很感兴趣。如果突然有人知道答案,请在评论中写下,也许我试图从错误的角度出发。



我还要澄清,我无意抱怨某人,因此,在各部的答复中,我删除了所有带有负责官员姓名和签名的邮票。我有兴趣了解此系统的工作原理。



这一切是如何开始的?



一切始于以下事实:在2019年底,我意识到在我以前的专业活动领域中,我已经达到了一定的高峰并为我在该领域进一步发展:



  1. 没兴趣
  2. 可能,但它完全符合帕累托原则,在那儿我不得不花很多精力去寻找虚幻的前景,甚至还不如旅途开始时所希望的那样。


多亏了一次与朋友的重要会面,我才意识到,出于各种原因而被淹没的长期愿望就是“走向IT”,即ML,尤其是我可以成功。我不会描述我的学习方式,但是它确实非常激烈,富有成效,而且最重要的是令人兴奋,所以我不得不强迫自己休息。最后,我破产了。他辞掉了以前的工作,几乎把所有的业余时间都花在学习上。



随着时间的流逝,我开始考虑在新的业务中找到工作,但随后与Covid的故事就开始了。另外,机器学习最近已成为一个非常时尚的话题,这已经不是什么秘密,因此,在劳动力市场上出现了大量的初级/培训生在DS领域的求职者。结合起来,这两个因素对我个人而言意味着即使在雇主的几个胜任力上都取得了不错的成绩,我也像我一样只是该领域许多新人之一,而且我几乎没有机会进入面试阶段。



反思并意识到我可以与其他人区分开来的唯一一件事就是优秀项目的存在,因此我开始为第一个项目寻找主题。当我刚开始学习ML时,我突然想到了很多想法,但是当我选择项目主题时,这些想法变得越来越少,因为已经深入研究了具体细节,所以我开始有所不同的思考-“是的,这是一个好主意,但是开放的简历并不是合适,因为他只有接受过初步培训并教我自己,我将没有足够的资源和数据,除非您不使用GAN网络并在其帮助下生成图像。然后,对API免费版本的请求受到限制,要卸载普通数据集,您将需要大量时间或金钱等等。



决定从另一端走,我回到Kaggle,打开了数据集,按“热门度”对它们进行排序,然后它突然出现在我身上。Covid在院子里!有什么更好的办法-不仅制作一个项目,而且制作一个关于炒作的项目!然后他们可能会注意到我,并用手将我撕开。所以我当时想。是的,子



展望未来,我不禁要指出,尽管我的优势很小,但我对xx的回答要么被公开忽略,要么被礼貌地拒绝了,即使是公司内部员工推荐的那些空缺。在仅仅一个月的求职中,大约有70份来自我身边的答复,似乎我接受了3次面试,之后我自己做出了否定的决定。我不知道每个案例到底是什么情况,但是我怀疑问题出在年龄(30岁以上),缺乏专门的教育/经验和弯曲的项目。



但是具体来说,这个求职故事的结局很好-我的现任经理本人是在xx上找到我的,我很快经历了面试的各个阶段,现在我正在做分析,包括使用ML,我真的很喜欢。而且,他们也为此付出代价!由于我的内向,我可能不会对我的领导说这句话,但是如果您突然读到这个



,我将非常感谢。)好吧,好吧,我对歌词的方向也太在意了。更紧密



开展业务



在同一个caggle数据集(https://www.kaggle.com/parthachakraborty/pneumonia-chest-x-ray)上获得了所有内容之后,我编写了一个小型的顺序网络,其准确度约为85%。结果,我拍摄了一个整体为肺炎的数据集,而不是由covid引起的肺炎,因为我没有找到包含COVID-19大量照片的照片集,但是那时我对增强方法知之甚少。



幸运的是,我记得我有一位放射科医生,在他的帮助下,我了解了一些有关CT扫描和X射线检查方法对肺炎诊断的区别的细节。我还向他发送了按模型分类的图像,这些图像是应“感染肺炎的肺部X光片”的要求从巨大的蜘蛛网中拍摄的。结果比我预期的要差一些。因此,在几张被网络认为是细菌性肺炎的照片中,实际上存在结核病,这根本不在训练样本中,但否则错误百分比对应于model.score(X_valid,y_valid)。



我很高兴。尽管如此,我仍在进行真实的数据科学研究,并没有进行第70次提交,以试图突破最高的1%预测墨尔本的价格。如果我发现当地房地产经纪人在评估房屋时遇到麻烦,我就不会感到惊讶。对不起,我无法抗拒。



总的来说,我很受启发,发出了很多新的回复,然后……再也没有了。



当我想到这个主意时,我不能说我只受到和平与和平等善意的指导,要拯救穷人和其他人。不,我的目标是尽快找到工作,为此,我必须以积极的方式从同一个“我想成为ML”的人群中脱颖而出。



但是同时,经历了青春期的危机“我们为什么在这里?”作为一个无神论者,我自己确定了自己的信条-我想使世界变得更美好,因为以我的理解,其余的都没有大规模的实际价值。理想主义和天真?是的,是这样,我所做的事情以及为什么要撰写这篇文章都是基于我的这些素质。



我决定写信给俄罗斯联邦总统招待会,大约是以下字样的提案(由于它以特殊形式写在招待会网站上,所以我没有保留确切的案文):为了发展国家,即在ML在国家各个领域中的应用框架内,我提出以下建议:组织X射线图像的收集和存储,并使这种存储可用于ML方法进行处理以及提供反馈的可能性。接下来,我简要介绍了我的模型,并指出即使我的知识量很小,我仍然能够创建一个推荐模型,该模型可以与放射线医生一起工作并很有用。在俄罗斯,有大量的DC爱好者具有很高的知识/技能,他们不仅可以在医学领域做很多事情,而且在原则上可以应用ML的其他领域。



不幸的是,我不记得上诉的确切文本,因为它是在三月或四月,但是一般含义是完全相同的。



在开发这个主题时,现在我要补充一点,原则上,有必要收集和汇总尽可能多的开放数据并将其推广到Kaggle的类似物中,在那里也可以设置任务,讨论其解决方案并找到最佳解决方案。 Rosstat在数据发布方面已经做过类似的事情,我什至设法进行了分析,但是这个话题需要进一步发展。



该邮件已注册,并在其中单独寄出一封信,但是当我看到答案来临时,我仍然感到非常惊讶。最初的答复是卫生部。简短明了。







如我所见,答案的实质是“好,谢谢,不要。”



我以为这是故事的结局,但另一个答案来自工业和贸易部。答案非常详细,但我感到要么给他们提供了歪曲的信息,要么就是他们误解了我。



















我没有要求任何财政援助来执行该项目,而且,我也没有写一个我想参加的词(尽管我自然不会拒绝)。好吧,他们回答了,很好,并为此表示感谢。



如果我不定期遇到诸如此类 或此类(非常新鲜)特别是此类的新闻,那我肯定会忘记这个故事看完之后,我笑了一下,因为这正是我写的。



结果



嗯,好吧,帖子出来了。



这些是我想问的关键问题。



在该州的“业务流程”中,谁参与了ML的实施?谁在领导这些人?



是集中的还是每个部都有自己的数据科学家?他们甚至在国家机关中吗?



我看到了直到2030年的国家人工智能发展战略的文字,但是我还有很多问题,我可以问谁?当然,要获得合理的答案。



考虑到我收到的答案,我有些怀疑该策略不仅是一份意向声明,而且是一项真正的计划,并且这项整体工作不会为几个“自己的”展示宠物项目提供资金,然后提及该项目,并指出该策略的成功。



总的来说,任何阅读这篇文章的人都在执行此策略中的任何程序吗?



谢谢大家花n分钟的时间!



All Articles