SORU
24 Kasım 2009, Salı


Nasıl k-ortalamalar kümeleme kullanırken k belirleyebilirim?

k-means clustering, üzerine araştırma yapıyorum ve net olmayan bir şey k) değerini seçin. Sadece deneme yanılma meselesi mi, yoksa daha fazla mı?

CEVAP
8 ŞUBAT 2010, PAZARTESİ


Bayesian Bilgi Kriteri (BIC) en üst düzeye çıkarmak

BIC(C | X) = L(X | C) - (p / 2) * log n

nerede L(X | C) log-olabilirlik veri X göre model C, p parametre sayısı model C n sayı noktaların kümesi. İCML 2000 yılında Dan Pelleg tarafından "X-means: extending K-means with efficient estimation of the number of clusters" ve Andrew Moore bakın.

Başka bir yaklaşım k için büyük bir değer ile başlar ve artık açıklama uzunluğu azaltır kadar sentroidler (k) azaltma) kaldırma tutmaktır. Horst Bisküvi, Ales Leonardis, "MDL principle for robust vector quantisation" ve Alexander Selb bakınDesen Analizi ve Uygulamalarıvol. 2, p. 59-72, 1999.

Son olarak, bir küme ile Başlangıç noktaları her bir küme için atanmış bir Gauss dağılımı kadar bölme kümeleri devam edebilirsiniz. "Learning the k in k-means" (NİPS 2003), Greg Hamerly ve Charles Elkan bu BIC daha iyi çalışır, ve BIC modelin karmaşıklığı yeterince güçlü bir şekilde cezalandırmak değil, delil gösterin.

Bunu Paylaş:
  • Google+
  • E-Posta
Etiketler:

YORUMLAR

SPONSOR VİDEO

Rastgele Yazarlar

  • Joshua Benedict

    Joshua Bened

    26 EKİM 2013
  • Numberphile

    Numberphile

    15 EYLÜL 2011
  • placeboing

    placeboing

    7 Mart 2006