我们的大多数
, « ». 2011 . ( , 13, 107), ,
«»
, , «». , .
- — .
- — , .
- — .
- — .
- — 5 .
, , « », 98% .
8 000 . , 40 000 . , ? , , , , , . ,
, , Data Accelerator. —
, , , . , .
: Data Scientist, Data Engineer, Data Analyst, Product Owner
:
- , ( );
- eCom, .
, .
, , , : . , , 3 , , , 6 . , , , …
, . . « » , , .
, — . , , . , , 1. , , , . . .
— . , . , , . 2500 , 43, . «».
,
, , 60% , . , 81%, ,
MVP.
6 , proof of concept , , , . , , .
, , , , , — , , . , , , .
«-1».
, , : « , , , , ». , , « » , . 4 , .
, .
ML- .
,
- Catboost, , .
- , .
- , , , , , , .
- 70 .
- , Permutation Importance , Catboost.
- , 80/20.
- , .
- , , , train/
valid- . - DVC, S3.
:
ROC-AUC : 0.68- Recall: 0.77
— . , DataLake GreenPlum. , MongoDB, . GreenPlum MongoDB
6 , 15% 12%,
, , . , — , , . .