最小全域木の辺長の総和を用いたデータマイニング
Data Mining using Total Edge Length of Minimum Spanning Tree

2016年05月01日

データマイニングではPearsonの積率相関係数が広く使われてきた。しかし、この相関係数は直線的な関係のみを検出可能であり、放物線のような非線形な関係の検出が不可能である。人間は放物線のような非線形な関係も検出できるため、人間の認知の手法に着想を得て関係性を評価しようと考え、人間の認知と類似している最小全域木を用いてデータの関係性を評価する手法を構築し、様々な関係を抽出可能であることを実証した。

In the field of data mining, the Pearson product-moment correlation coefficient is widely used. However, this indicator can evaluate only linear dependencies. We propose a new indicator to evaluate both of linear and non-linear dependencies using minimum spanning trees, which is similar to human perception mechanism. We also demonstrated that our indicator can detect various dependencies such as parabolas, ellipses, and T-shape lines.

Fuminori Okuya

Contact: okuya23@akg.t.u-tokyo.ac.jp