組込み可能な決定木の計算ライブラリ
NAG データマイニング コンポーネントでは決定木の計算を行うための 各種機能が提供されています。NAG データマイニング コンポーネントはC言語, C++, Java, VB, VBA(Excel)など様々な環境からご利用いただけます。またWindows, Linux, Solaris など様々なOSをサポートします。
NAGが提供する決定木の機能
NAGが提供する決定木(decision tree) の機能は再帰的な区分化手法を用いてデータレコードをリーフノードに 対応付けます。
図は簡単なバイナリ決定木の例を示したものです。この例の場合、ルートノードA でのテストの結果、
データは2つの子ノード、すなわち中間ノードB とリーフノードC に区分されます。
ノードB のデータはさらにリーフノードのD と E に区分されます。それぞれの親ノードには2つの
子ノードが付帯することから、このような決定木はニ分決定木(binary tree)と呼ばれます。
一般に親ノードが1より大きな任意の数の子ノードを持ち得る場合の決定木は
n項決定木(n-ary decision tree) として知られています。
データの区分はノード上でデータのテストを行い、その結果を評価することによって行われますが、その場 合、ある基準に基づき最良のテストが保持されます。NAGが提供する決定木分類関数の場合、 この基準としては不純度に関するGini指標、もしくは最小エントロピーが用いられます。個々のリーフ ノードを従属変数値に対してラベリングするためには平均値や最頻値といった基本統計量が用いられます。 NAGのデータマイニングコンポーネントには分類用の機能としてニ分決定木とn項決定木を計算する関数が用意されています。
【NAGのデータマイニングコンポーネントのドキュメント】
イントロダクションガイド
ユーザーガイド
提供されている決定木関数(サブルーチン)
nagdmc_gini_tree - gini指標基準で算出されたニ分決定木を構築nagdmc_save_gini_tree - ニ分決定木を保存
nagdmc_load_gini_tree - ニ分決定木を読込む
nagdmc_free_gini_tree - ニ分決定木を解放する
nagdmc_predict_gini_tree - ニ分決定木を用いた予測
nagdmc_entropy_tree - 最小エントロピー基準にてn項決定木を構築
nagdmc_prune_entropy_tree - n項決定木の枝狩り
nagdmc_save_entropy_tree - n項決定木を保存
nagdmc_load_entropy_tree - n項決定木を読込む
nagdmc_free_entropy_tree - n項決定木を解放
nagdmc_predict_entropy_tree -n項決定木を用いた予測
その他データマイニング機能一覧