5个步骤为数据科学项目生成独特的想法

在任何数据科学项目中,最困难的部分可能是提出一个原始但可行的想法。寻找这种想法的专家很容易陷入“数据集陷阱”。他花了许多时间浏览现有的数据集,并试图提出有趣的新想法。但是这种方法有一个问题。事实是,仅查看现有数据集(使用KaggleGoogle数据集FiveThirtyEight)的人只能看到他们研究的数据集所关注的一小部分任务,从而限制了他们的创造力。



有时我喜欢探索我感兴趣的数据集。如果我已经为来自Kaggle的数据建立了成功的模型,并且已经为其创建了无数模型,则将没有实际价值,但至少可以使我学习一些新知识。但是数据科学家是致力于创造新的,独特的,可以为世界带来真正利益的人们。







您如何产生新想法?为了找到这个问题的答案,我结合了自己的经验和创造力研究的结果。这导致我能够提出5个问题,这些问题的答案有助于找到新的想法。在这里,我还将举例说明由于我提出的方法而发现的想法。当您搜索此处提出的问题的答案时,您将走上产生新想法的道路,并能够最大程度地发挥您的创造潜力。因此,您将拥有可以在数据科学项目中实施的独特的新想法。



1.为什么我要开始一个新项目?



当您考虑开始一个新项目时,您就有一个意图或目标。首先,您需要找到关于为什么要在数据科学领域创建另一个项目的问题的答案。大致概述您要实现的目标将帮助您专注于找到想法。因此,请考虑要为该项目创建什么。以下是一些选项:



  • 这是一个投资组合项目,您将向潜在的雇主展示。
  • 这是有关概念,模型或探索性数据分析的文章的草稿。
  • 这是一个项目,可以让您练习一些东西。例如,我们可以谈论自然语言处理,数据可视化,主要数据处理以及某些特定的机器学习算法。
  • 这是一个非常特殊的项目,此列表中未描述。


2.我的兴趣和经验是什么?



考虑此问题的主要原因有三个。



  • 首先,请记住数据科学中用于描述该领域所需技能的维恩图特定领域的知识是每个数据科学家都应该拥有重要资产仅当该数据所属的主题区域清晰时,才可以通过处理数据来解决某些问题。否则,将应用算法,创建可视化和预测,这些可视化和预测对于适当配置文件的任何从业者来说似乎都不足够。而且,如果您所做的没有意义,那么为什么还要这么做呢?
  • -, , , , . , . , . , , .
  • -, , , . , , - . 


让我举一个例子。我感兴趣并有经验的知识领域包括系统的环境和社会经济可持续性,财务,流行文化,自然语言处理。专注于这些主题可以帮助我充分利用现有资源。多亏有了这些知识,我才能确定自己是否可以受某种启发而提出一个可以实施的新想法。



3.您如何找到灵感?



灵感的主要来源是阅读。搜索想法时,可以通过阅读各种材料找到有趣的主题:



  • , , . , , . , WIRED , , Google . , . , Google.
  • . , . , GPT-2 , , , , , , . - ?
  • . , , Data Science, , . , NLP- «», , , . - ? , ? GPT-2.


如果我们谈论灵感的其他来源,那么在日常生活中就会发现灵感,而不会陷入新的想法。每当您对问题感兴趣时,请考虑是否可以使用数据处理技术回答该问题。例如,我最近偶然发现了《男孩》的预告片,并在IMDb上找到了很多关于它的正面评价。我问自己:“是否有任何迹象表明电视节目中的暴力场面数量增加?”我继续说道:“是否有越来越多的观众喜欢暴力电视节目?”如果您有兴趣,请花点时间研究相关数据。



您如何从上述灵感来源中产生项目构想?神经科学家已经确定了与产生想法相关的三个不同的心理过程:



  • 您可以将现有的想法组合在一起以创建新的想法(组合创造力)。例如,各种项目分析了Airbnb上发布的租金报价。项目旨在分析房地产市场。如果将这些想法结合起来,就可以找到一个问题的答案,即某个城市的房价是否由于Airbnb而上涨。
  • , ( ). , -, , , . , , - .
  • - , ( ). — . . . : , , .


4. ?



一旦确定了总体研究方向,您将需要搜索数据,这些数据将使您了解如何以数据科学项目的形式实施您的想法。这对于确定创意是否成功至关重要。在回答本节标题中的问题时,您应该考虑在现有数据存储中拥有所需内容的可能性。您可能必须自己收集必要的数据,这使任务变得复杂。因此,这里是数据源的概述:





如果找不到能够帮助您实现项目构想的数据,请重新设计构想。尝试从可以使用已有数据实施的原始想法中获取想法。同时,问自己一个问题,为什么您找不到所需的数据。您感兴趣的领域有什么问题?你能为这个做什么?仅这些问题的答案就可以导致新的数据科学项目的出现。



5.找到的想法可以实现吗?



所以你有一个很棒的主意!但是可以实现吗?再次执行想法生成过程中的步骤。考虑一下您想要实现的目标(问题编号1),是否对所选区域感兴趣,如果您有经验(问题编号2),您是否有实现该想法所需的数据(问题编号4)。现在,您需要确定以下内容:您是否具有实施该想法和实现目标所需的技能。



重要的是要考虑到计划在此项目上花费的时间等因素。您可能不会针对所选主题写博士学位论文。因此,您将在找到的构想的框架内进行的项目可能只影响其中的一部分。也许只是在学习一些新知识时,您才需要在将来实施该想法。



完成上述5个步骤以产生想法之后,您应该有一个可以回答的问题,愿意花很多时间在实现目标上。



结果



  • . , , , . — , , , . — . , , .
  • - . . , - , . , . , , , , .
  • 不要害怕重新开始。无论您做什么,都总是学到一些新东西。每次编写一行代码时,您都在练习和扩展知识和技能。如果您意识到实施所发现的想法不会使您更接近目标,或者发现该想法不可行,请不要害怕离开并继续前进。您花费在寻找这个想法上的时间不会对您造成损失。有必要明智地评估从实施该构想中可以获得的收益。


使用这里描述的技术,我不断地发现我的数据科学项目的原始想法。我希望这项技术对您也有用。



您如何为数据科学项目寻找新的想法?










All Articles