エクストラ ツリーによる分類と回帰アルゴリズムの仕組み

エクストラ ツリー (Extra trees) (Extremely Randomized Trees の略称) は、決定木を使用する教師付きアンサンブル機械学習法で、[AutoML を使用したトレーニング (Train Using AutoML)] ツールによって使用されます。 決定木のしくみについての情報は、「決定木による分類と回帰アルゴリズム」をご参照ください。 この手法はランダム フォレストに似ていますが、より高速に動作できます。

エクストラ ツリー アルゴリズムは、ランダム フォレスト アルゴリズムと同じように多数の決定木を作成しますが、各ツリーのサンプリングがランダムで、置き換えは行われません。 これにより、一意のサンプルを含む、各ツリーのデータセットが作成されます。 フィーチャのセット全体内の特定数のフィーチャも、各ツリーに対してランダムに選択されます。 エクストラ ツリーの最も重要で独自の特性は、フィーチャの分割値をランダムに選択することです。 データを分割するジニまたはエントロピーを使用して局所的に最適な値を計算する代わりに、アルゴリズムは分割値をランダムに選択します。 これにより、ツリーは分散化し、無相関になります。

参考資料

Geurts, Pierre, Damien Ernst, and Louis Wehenkel. "Extremely randomized trees." Machine learning 63, no. 1 (2006): 3-42.

What is the difference between Extra Trees and Random Forest?


このトピックの内容
  1. 参考資料