В описании метода G-means есть не очень понятный пункт разбиения центра кластера (с) на 2 новых (с'1 = с+m / c'2 = c-m). Как определить число m ???
Предлагается следующие 2 способа:
1) The first method chooses m as a random d-dimensional vector such that ||m|| is small compared to the distortion of the data. - Тут не понятно как оценить искажение данных.
2) A second method finds the main principal component s of the data (having eigenvalue LAMDA),
and chooses m = s*SQRT(2*LAMDA/PI). - Как найти число s и LAMDA ?