sim sim开放!-我们如何启动开放数据项目



你好!我的名字叫Sergey Folimonov,在DomClik,我负责直接营销和客户沟通。最近,我还担任Open Data项目的PO ,我想向您介绍该产品的创建历史,重点介绍我们必须面对的问题,我们所犯的错误以及最终结果及其变体。用。



公司内部由数据驱动的文化固然很好,但在开放内容,开放源代码解决方案和开放数据的概念日益普及的当今世界中,您不仅希望使用信息,而且还希望共享信息。这就是促使DomClick创建“打开数据”的原因。



开始吧!



我很早就参与了产品开发。好吧,很早。假设我们在俄罗斯联邦地图的背景下,从UX设计师那里得到了两包tra 2样机,管理层表示在MVP投入生产之前有2周的时间。在几个小时内,一群完全不同的团队的员工组成了一个狂热者(开发人员,分析师,设计师,数据工程师),为发布产品而全力以赴。







接下来的两周,我们在真实的驱动器上从头开始开发了该项目,试图避免任何复杂的过程,并尽可能插入拐杖,以免延迟MVP并检查:“我们能做什么?”



第一次冲刺的结果:按天/周/月细分的所有承诺数据都可以在地图(区域和主要城市的统计数据)和图表(城市等级,动态数据)上找到。但是,您可以猜到,该版本现在只剩下屏幕截图:







这里有很多数据,该站点在功能上完美运行,但是完全没有考虑过UX。结果是:目不转睛,客户的路径不清晰,并且可以从该项目中学到什么。展望未来,我会说项目的第一个版本中的任何内容都没有在以后的开发中重复使用。



似乎要花上两周的时间...但是,正是对现成的快速概念的了解以及对它的缺点的理解使我们能够形成对服务的最终要求和希望。我们不做任何详细介绍,而是决定在第一阶段以表格形式显示数据,在下一步中为用户提供动态图表,然后在地图上进行可视化处理,并使用预测模型来建立预测。



可以争论一下前两周是否是一个错误,是否有可能避免浪费时间并立即制造出可以向客户展示的产品。是的,我们可能可以在开始的几天里花一些时间来设计用户体验,进行几次访谈和调查,然后花2个月而不是2个月的时间进行开发。但是我故事的寓意是,您不应该害怕成为快速拐杖的MVP。加快工作速度和高昂的热情使我们强烈召集起来,创造出一个非常好的产品,是的,不要害怕将最初的草图丢进垃圾箱:这比将原始版本变成一个整体要好得多。



生活后死亡MVP



在该项目的进一步工作过程中,我们遇到了许多非同寻常的问题。我将竭尽全力告诉他们,以免使读者对抵押业务的细节感到厌烦。



学习用自己的名字称呼事物



在收集各种指标的数据的阶段,我面临这样一个事实,即公司中的不同人员可以将不同的事物称为相同的事物,而对相同的事物进行不同的称呼。例如,有两个不同的人给我提供了有关区域范围内交易数量的数据,而这些数量根本就没有冲突,因为可以一次将多个业务实体称为交易。事实证明,我一方面进行房地产对象电子注册交易,另一方面进行抵押交易。并且一个月内同一地区的数据可能不一致。此外,在两个方向上:登记的数量可能比抵押交易多(如果突然有很多客户开始购买没有抵押的房地产而只是购买电子登记),(如果该地区对电子注册服务的需求不大,并且抵押是在没有电子注册服务的情况下进行的,则更少)。



这种情况导致我们需要创建参考书,以免混淆自己的定义,并尽可能多地向门户网站上的用户解释所有指标。







我们按时间间隔汇总不同的数据



当涉及累加指标(以及我们拥有的第一个指标)时,汇总对我们没有提出任何问题。8月份的抵押交易数量:我们计算并计算8月1日至8月30日之间发行的所有交易。我们在“过去30天”期间进行了同样的操作,这为每个指标提供了最相关的信息。



但是,非加性指标的出现使我们开始思考。例如,在特定时间点发布的用于出售公寓的广告数量不能算为“八月”。如果在某个地区的8月1日,在店面发布了1000个广告,而在8月30日-1200个广告,那么应该显示多少个?平均每天?每月中位数?月中值?我们决定,如果我们不显示一段时间内,而是在该天的最后一天显示此类指标,则对我们和用户来说更容易理解。如果选择了8月,则数据为8月30日;否则为8月30日。如果选择了“过去30天”,则数据为昨天。与此相关的信息也放置在目录中。







确定我们的开放程度



在数据准备的第一阶段,我们希望显示尽可能多的信息。如果我们知道2020年7月在H市执行了65次电子注册交易,那么让我们告诉用户!但是,在某些时候,我们考虑了竞争对手如何利用这一优势。毕竟,在城市背景下甚至在每周动态的情况下披露绝对值都可能导致以下事实:数据将用于检验特定住区内的各种假设。我们的数据每天都在更新,这意味着市场参与者有机会每天监控几乎所有主要业务指标,开展各种活动并立即评估其对我们结果的影响。此外,还披露了两个指标(例如(申请数和批准的申请数)实际上可以揭示您绝对不想显示的另一个指标(例如,批准率)。



为避免出现不愉快的情况,我们决定间隔一定时间“关闭”区域和城市的关键指标。而且,表中的评级建立和排序始终根据度量标准的实际绝对值进行,只是不会显示在最终用户的最前面。







我们为谁以及为什么打开数据



现在,门户网站具有四个部分(流),每个部分包含以表格形式列出的5-6个指标,并具有区域等级。当您单击某个区域时,您可以进入该区域并查看该区域内城市的等级。可以选择时间间隔(从2019年1月开始的所有月份和“过去30天”),还可以按地区和城市进行搜索。



这种粒度允许将数据用作市场研究的材料。例如,我们与SberIndex一起基于开放数据对房地产市场进行了分析。特别感谢SberIndex实验室主任Nikolai Korzhenevsky的积极研究立场。分析中的



复制粘贴摘录:



  • 根据DomClick的数据,过去两个月,该国的房地产平均价格同比上涨了3.0%。在一级市场上,报价年增长率达到6.2%。
  • 供应价格上涨的领导者中有旅游区:

    • 哈巴罗夫斯克地区(同比18.9%),
    • 加里宁格勒地区(同比18.0%),
    • 阿尔泰共和国(同比增长17.6%)。
  • 在抵押贷款利率迅速下降的背景下,7月至8月发行的贷款的动态也仍然接近创纪录的价值。根据我们的估计,已发行抵押贷款的数量同比增长44%。
  • 据Open Data称,自大流行以来,DomClick已批准的抵押贷款申请中近一半已在线提交。


除了市场分析和研究,“开放数据”还可一次对多个受众有用:



  • , / , ..
  • , .
  • Excel .
  • , / , .
  • // . , :)


下一步是什么?



  • 在不久的将来,我们计划专注于构建图表,以便更方便地跟踪几个月和几周内指标变化的动态。布局已经准备就绪,数据已经准备就绪,工作正在进行中。
  • 同时,我们选择并开始收集新部分的数据,试图找出对用户最有趣的部分。
  • 我们希望更方便地将汇总数据导出到Excel。
  • 同时,我们正在研究用于可视化RF图(带有热图或点)的指标的选项 也就是说,在某种程度上,我们正在回归产品的第一个版本的想法,但是已经有了我们背后的经验,友好的团队和在生产中的项目。


如果您对门户网站有意见/问题,或者对“打开”数据感兴趣,请在评论中写下来,我将尽力回答所有人。



All Articles