Nasıl k-ortalamalar kümeleme kullanırken k belirleyebilirim? | Netgez.com
SORU
24 Kasım 2009, Salı


Nasıl k-ortalamalar kümeleme kullanırken k belirleyebilirim?

k-means clustering, üzerine araştırma yapıyorum ve net olmayan bir şey k) değerini seçin. Sadece deneme yanılma meselesi mi, yoksa daha fazla mı?

CEVAP
8 ŞUBAT 2010, PAZARTESİ


Bayesian Bilgi Kriteri (BIC) en üst düzeye çıkarmak

BIC(C | X) = L(X | C) - (p / 2) * log n

nerede L(X | C) log-olabilirlik veri X göre model C, p parametre sayısı model C n sayı noktaların kümesi. İCML 2000 yılında Dan Pelleg tarafından "X-means: extending K-means with efficient estimation of the number of clusters" ve Andrew Moore bakın.

Başka bir yaklaşım k için büyük bir değer ile başlar ve artık açıklama uzunluğu azaltır kadar sentroidler (k) azaltma) kaldırma tutmaktır. Horst Bisküvi, Ales Leonardis, "MDL principle for robust vector quantisation" ve Alexander Selb bakınDesen Analizi ve Uygulamalarıvol. 2, p. 59-72, 1999.

Son olarak, bir küme ile Başlangıç noktaları her bir küme için atanmış bir Gauss dağılımı kadar bölme kümeleri devam edebilirsiniz. "Learning the k in k-means" (NİPS 2003), Greg Hamerly ve Charles Elkan bu BIC daha iyi çalışır, ve BIC modelin karmaşıklığı yeterince güçlü bir şekilde cezalandırmak değil, delil gösterin.

Bunu Paylaş:
  • Google+
  • E-Posta
Etiketler:

YORUMLAR

SPONSOR VİDEO

Rastgele Yazarlar

  • RealPapaPit

    RealPapaPit

    16 Mart 2009
  • Shanice Caruthers

    Shanice Caru

    27 EKİM 2011
  • UrAvgConsumer

    UrAvgConsume

    1 Ocak 2012