在本材料中,我想谈一谈如何为想要独立获取DS,AI和ML领域知识的人服务。应用这里建议的教学方法可以导致学习新事物的良好进展。另外,在这里,我将共享指向我使用的资源的链接,毫无疑问,我准备将其推荐给其他人。
学习一些数学学科
数学,即使有人不喜欢它,在我们感兴趣的领域中也非常重要。我认为可以肯定地说,读过这篇文章的人已经在学校学习了一些数学知识。这是一个很好的基础,但是对于想要在DS,AI和ML领域发展的人来说,这还不够完善。也就是说,在这里您需要比在学校更深入地研究数学,您必须从统计,代数和其他数学学科中学习一些东西。我会放在一起的DS数学知识资源的列表,但是这已经为我做在这个文章。他们做得很好。
学习编程
如果您只是开始自学,请不要直接学习如何编写用于机器学习的代码。相反,值得学习与任何领域无关的基本编程概念。了解编程知识,熟悉现有的不同类型的代码,了解如何正确编写程序。这非常重要,因为当您精通编程时,您将学习许多基本思想,这些思想将在整个DS生涯中为您提供良好的服务。
不要着急,不要努力立即学到一些困难的东西。您对基础知识的理解程度将影响您整个未来的职业生涯。这里您可以找到非常好的视频教程,向您介绍编程和计算机科学。即,他们找出您需要了解的最重要的事情。花一些时间解决这个问题,并尝试了解您所学的一切。
选择一种编程语言并正确理解
DS,AI和ML领域中使用了许多编程语言。这里最常用的是Python,R,Java,Julia和SQL。在这些领域中可以使用其他语言,但是出于某种原因,我列出的语言比其他语言使用得更多:
- 他们很容易学习。如果您分配足够的时间来研究它们并在训练中表现出恒心和恒心,那么您就可以足够快地取得一定的成功。
- , , .
- , .
- , , , DS, AI ML.
- — .
学习多种编程语言没有错。而且,实际上,了解多种语言是很有用的。但是,在学习编程时,您不应该着急。您需要尝试在一段时间内只学习一种语言,否则您会很困惑。因此,最好一次学习一种语言,要特别注意对您的工作有用的语言机制。我建议选择Python作为您的第一语言。这是一种相当简单的语言,即使是初学者也可以轻松理解。另外,我建议您先学习Python的通用编程,然后再使用专门的Python工具进行数据分析。
学习收集数据
通常,没有人会为您提供专门为您提供的数据,有时您可能根本没有任何数据。但是,无论如何,您都需要找到一种方法来收集将要使用的数据。您工作的组织可能有一个很好的数据收集系统。如果是这样,这对您来说是一大好处。如果您的组织没有这样的系统,那么您必须找到一种收集数据的方法。但是,我们不是在谈论任何数据,而是在谈论高质量的信息,您可以根据这些高质量的信息进行有效的工作,以实现自己的目标。数据收集与它们的深入分析并没有直接关系到“数据挖掘”。数据收集是分析之前的工作步骤。
可以在Internet上的许多地方找到可以免费使用的开放数据。有时,您可以使用网络抓取技术从网站收集所需的数据。Web抓取是一项非常重要的数据科学家技能,因此我真的要求在DS,AI和ML领域工作的每个人都掌握这一技能。这是刮网的好指南。
数据也可以存储在数据库中,因此数据库管理的基本知识以及与数据库交互的技能将对您非常有用。特别是,SQL知识在这里非常重要。在此处学习SQL 。
学习处理数据
我在这里要谈论的通常被称为数据整理。此过程包括清除现有数据。它使用对数据的探索性分析,并从中删除所有不必要的数据。此过程还包括对数据进行结构化,使其成为可以使用的形式。处理数据的这一阶段是最困难,最耗费精力的阶段。您在学习过程中遇到的数据已经准备好进行分析。但是您在现实世界中遇到的数据可能是完全原始的。如果您真的想成为一名数据科学家,则需要找到真实的数据并找到使它看起来不错的方法。
几乎在任何地方都可以找到真实数据。例如-开Kaggle。这个强大的平台拥有来自全球许多公司的数据。主数据处理是一项非常繁琐的活动,但是如果您定期且持久地进行处理,您将逐渐意识到它也是一项非常有趣的活动。这是一些有关原始数据处理的好讲座。
学习可视化数据
如果您是DS,AI或ML方面的专家,并且精通您的业务,那么您不应忘记,对您而言显而易见的东西可能对其他人来说是完全无法理解的。例如,不要指望他们能够通过查看数字列来得出结论。必须学习可视化数据,以便其他领域的专家可以使用您的工作结果。 “数据可视化”通常称为以图形形式显示数据的过程。这样的数据表示,即使对于在DS,AI和ML领域没有专门知识的人,也可以从中受益。
有很多方法可以可视化数据。因为我们是程序员,所以我们数据可视化的主要方法应该是编写适当的代码。它速度很快,不需要购买专用工具。在编写用于数据可视化的代码时,可以使用为我们使用的编程语言创建的许多免费和开源库。例如,存在用于Python的此类库。这些是Matplotlib,Seaborn和Bokeh。这是Matplotlib上的视频教程。
可视化数据的另一种方法是使用闭源工具。例如-Tableau... 这些工具很多,它们可以为您带来不错的效果,但是它们并不是免费的。Tableau是这些工具中最常见的工具之一,我经常使用它。我建议任何参与数据分析和可视化的人学习Tableau。这是此工具的良好指南。
人工智能和机器学习
由于AI和ML是数据驱动的,因此可以将它们视为DS的子部分。 AI和ML是基于教学机器的行为,其行为类似于人类的行为。为此,使用了专门准备的数据,并将其传输到机器。计算机模型可以教给人类很多能力。为此,他们经过培训并得到了预期的结果。在这种情况下,“机器”可以被视为完全没有知识的小孩。逐步教会这些孩子识别物体,说话。他们从错误中学习,并且随着学习,开始更好地解决分配给他们的任务。汽车就是这种情况。
AI和ML技术使用各种数学算法使机器栩栩如生。人类仍然不知道这些不断改进的技术的功能极限。如今,人工智能和机器学习技术已广泛用于解决认知问题。这些是对象检测和识别,面部和语音识别,自然语言处理,垃圾邮件检测和欺诈检测。此列表可以持续很长时间。
有关AI和ML的更详细的故事值得单独发表。同时,我可以推荐此视频介绍有关这些技术应用的一般问题。但是这里-数小时的机器学习视频教程。通过浏览这些视频,您可以获得与初学者甚至中级水平相匹配的ML知识。您将了解许多现有的机器学习算法,它们如何工作以及如何使用它们。之后,您应该具有足够的知识来开始创建自己的简单ML模型。您可以在此处阅读有关如何执行此操作的信息。
探索在线发布ML模型的方法
有一些工具可让您在Internet上发布ML模型。这使您可以让他们访问所有人。为了在Internet上发布模型,您需要对Web开发过程有很好的了解。关键是“发布模型”是指创建一个网页(或一组页面),从而可以在浏览器中使用该模型。另外,应该记住,项目的前端,其接口必须与后端,模型本身所在的项目的服务器部分交换数据。为了构建这样的项目,您必须能够创建服务器端API并在应用程序的前端中使用这些API。
如果您打算在云中发布模型,那么如果您要使用Docker技术,则对云计算和DevOps领域的全面了解将非常有用。
实际上,有许多方法可以在Internet上部署模型。我建议从学习如何使用基于Python的Flask Web框架开始做起。这是一个很好的教程。
寻找导师
自我学习很棒,但是没有什么能比从专业人士那里学习更好。事实是,通过这种方法,现实中使用的东西被同化了,这就是学习通过实践的方式。许多事情只能通过实践来学习。教练有很多优点,但请记住,并不是每个导师都能对您的职业或生活产生重大影响。这就是为什么找到一个好的导师非常重要的原因。
例如,您可以尝试使用Notitia AI平台解决此问题。... 在这里,为学生分配了个人导师,他们为学生的发展做出了个人和专业的贡献。导师带领那些想要在DS,AI和ML领域从初学者学习到专家水平的人。Notia AI也是同类中最实惠的平台。
结果
请记住,学习课程,阅读文章和观看视频不会使您成为数据科学家。您将需要由专业机构认证。此外,一些职位需要一定的教育资格。花时间进行自学,获得认证或获得您的学历证书,您就可以为实际工作做好准备。
您认为人们需要了解什么并渴望成为人工智能或机器学习领域的宝贵专家?