大家好 今天,ProductStar团队已为您准备了一篇文章,其中我们研究了决策树的一般操作原理和应用领域。
决策树是一种自动分析大型数据集的方法。在本文中,我们将研究操作的一般原理和应用领域。
决策树是强大的数据挖掘和预测分析工具。它有助于解决分类和回归问题。
, « …, ...». .
, , : , « 1000 , ».
( ), . , — .
, — , . :
— ;
— .
1950- . .
. ( ID3 4.5 5.0) , CART .
. — , — (node) (leaf). .
: , :
— , ;
— , .
, . , . , , .
. — , , — . , , , .
, . . , , .
, , .
?
, , . :
. . .
( ). .
. . , , .
— . ? , .
:
— ;
— , .
«» , - ( ), . , , . , , .
, , « ». S, :
n , Ci(i = 1..k);
m Aj(j = 1..m), .
:
S Ci, , . , , «» . , Ci. , .
S — . , . , .
S Ck. . Aj S, : a1, a2, …, ap), p — . S p (S1, S2, …, Sp), . , . , .
, . , .
: ID3, CART, C4.5, C5.0, NewId, ITrule, CHAID, CN2 . :
ID3 (Iterative Dichotomizer 3). . , ID3, . . .
C4.5. «» ID3, . 2008 Spring Science , C4.5 — Data Mining.
CART (Classification and Regression Tree). , . CART , .
4 :
.
.
.
.
.
, . , . — .
, - .
-
:
n — , Ni — i- , N — .
. , , . , .
Aj , .
. — . , :
Info(S) — , S , Info(Sa) — , , A.
Gain(A), . - « .
. , . — .
, . .
:
Q — , n — , pi — i- ( ).
0 1. 0, , . 1, , . , .
«» . , . - . . , .
. , . — .
, «».
:
. (, ). — . — . - .
. . .
. (, 7). .
, . , - . - , .
«» , . , 2-3 , .
— , , . — .
: NP- , , , . , 3 :
, .
: ( ) ( ).
, .
, , .
« » — . , .
, . , .
. , .
( ), .
:
. , « < 40 , ». .
, .
, «» , ( ).
.
.
, .
:
. , .
, - .
, - « », .
: , 100- .
, , .
?
. , .
:
. .
. ( ), (, ) ..
. .
. .
. .
. , - .
, . ProductStar vc -.
. , , .