Nasıl Mevkiinde Karma Hassas anlaşılır? | Netgez.com
SORU
18 EKÄ°M 2012, PERÅžEMBE


Nasıl Mevkiinde Karma Hassas anlaşılır?

LSH-boyut yüksek özellikleri ile benzer öğeleri bulmak için iyi bir yol gibi görünüyor fark ettim.

Kağıdı okuduktan sonra http://www.slaney.org/malcolm/yahoo/Slaney2008-LSHTutorial.pdf, hala o formülleri ile kafam karıştı.

Herkes kolay yoldan açıklayan bir blog ya da bir makale biliyor mu?

CEVAP
19 EKÄ°M 2012, Cuma


LSH için gördüğüm en iyi öğretici kitap: Büyük Veri Madenciliği. Bölüm Onay 3 - Benzer Öğeleri Bulma http://infolab.stanford.edu/~ullman/mmds/ch3a.pdf

Ayrıca, aşağıda slayt tavsiye ederim: http://www.cs.jhu.edu/~vandurme/papers/VanDurmeLallACL10-slides.pdf . Slayt örnek bana kosinüs benzerliğinin karma anlamada çok yardımcı olur.

Benjamin Van Durme & Ashwin Lall, ACL2010 iki slayt ödünç ve Kosinüs Mesafe biraz LSH Ailelerin sezgileri anlatmaya çalışacağım. enter image description here

  • Bu ÅŸekilde, iki daire w/ varkırmızıvesarırenkli, iki boyutlu veri iki noktayı temsil ediyor. cosine similarity kullanarak kendi LSH bulmaya çalışıyoruz.
  • Gri çizgiler rasgele seçilmiÅŸ bazı düzgün uçaklar.
  • Veri noktası veya gri bir çizgi üzerinde ve altında bulur baÄŸlı olarak, 0/1 olarak bu iliÅŸkinin iÅŸareti.
  • Sol üst köşesinde, beyaz/siyah kareler, iki veri noktaları sırasıyla imzası temsil eden iki satır vardır. Her kare bir bit 0(beyaz) veya 1(siyah) denk düşer.
  • Uçakların bir havuzu var bir kere, kendi veri konumu ile uçaklar için ilgili puan kodlamak. Havuzda daha fazla uçak var, açısal fark imza kodlanmış gerçek farkı daha yakın olduÄŸunu düşünürler. Ä°ki nokta arasında bulunan uçaklardan iki farklı veri bit deÄŸeri verecektir.

enter image description here

  • Åžimdi iki veri noktaları imzası bakıyoruz. Örnekte olduÄŸu gibi, sadece 6 bit(kareler) her bir veri temsil etmek için kullanıyoruz. Bu özgün veriler için LSH karma.
  • Ä°ki karma deÄŸeri arasındaki hamming uzaklığı 1, imzaları sadece farklı çünkü 1 bit.
  • Ä°mza uzunluÄŸu göz önüne alındığında, grafikte görüldüğü gibi açısal benzerlikleri hesaplayabiliriz.

Kosinüs benzerliği kullanarak python burada bazı örnek kod (sadece 50 satır) var. https://gist.github.com/94a3d425009be0f94751

Bunu PaylaÅŸ:
  • Google+
  • E-Posta
Etiketler:

YORUMLAR

SPONSOR VÄ°DEO

Rastgele Yazarlar

  • 24 Канал

    24 КанаÐ

    5 ÅžUBAT 2006
  • bashirsultani

    bashirsultan

    22 Mart 2010
  • DetroitBORG

    DetroitBORG

    29 Temmuz 2008