什么是决策树,在哪里使用?

大家好 今天,ProductStar团队已为您准备了一篇文章,其中我们研究了决策树的一般操作原理和应用领域。

决策树是一种自动分析大型数据集的方法。在本文中,我们将研究操作的一般原理和应用领域。

决策树是强大的数据挖掘和预测分析工具。它有助于解决分类和回归问题。

, « …, ...». .

, , : , « 1000 , ».

( ), . , — .

, — , . :

  • — ;

  • — .

1950- . .

. ( ID3 4.5 5.0) , CART .

. — , — (node) (leaf). .

: , :

  • — , ;

  • — , .

, . , . , , .

. — , , — . , , , .

, . . , , .

, , .

?

, , . :

  • . . .

  • ( ). .

  • . . , , .

— . ? , .

:

  • — ;

  • — , .

«» , - ( ), . , , . , , .

, , « ». S, :

  • n , Ci(i = 1..k);

  • m Aj(j = 1..m), .

:

  1. S Ci, , . , , «» . , Ci. , .

  2. S — . , . , .

  3. S Ck. . Aj S, : a1, a2, …, ap), p — . S p (S1, S2, …, Sp), . , . , .

, . , .

: ID3, CART, C4.5, C5.0, NewId, ITrule, CHAID, CN2 . :

  • ID3 (Iterative Dichotomizer 3). . , ID3, . . .

  • C4.5. «» ID3, . 2008 Spring Science , C4.5 — Data Mining.

  • CART (Classification and Regression Tree). , . CART , .

4 :

  1. .

  2. .

  3. .

  4. .

.

, . , . — .

, - .

-

:

n — , Ni — i- , N — .

. , , . , .

Aj , .

. — . , :

Info(S) — , S , Info(Sa) — , , A.

Gain(A), . - « .

. , . — .

, . .

:

Q — , n — , pi — i- ( ).

0 1. 0, , . 1, , . , .

«» . , . - . . , .

. , . — .

, «».

:

  • . (, ). — . — . - .

  • . . .

  • . (, 7). .

, . , - . - , .

«» , . , 2-3 , .

— , , . — .

: NP- , , , . , 3 :

  1. , .

  2. : ( ) ( ).

  3. , .

, , .

« » — . , .

, . , .

. , .

( ), .

:

  • . , « < 40 , ». .

  • , .

  • , «» , ( ).

  • .

  • .

  • , .

:

  • . , .

  • , - .

  • , - « », .

  • : , 100- .

  • , , .

?

. , .

:

  • . .

  • . ( ), (, ) ..

  • . .

  • . .

  • . .

. , - .

, . ProductStar vc -.

. , , .




All Articles