SORU
25 ŞUBAT 2010, PERŞEMBE


Cassandra MySQL geçiş - /Artıları Eksileri?

Arka plan biraz bu soru bir proje tek küçük bir örnek EC2 üzerinde çalışan, fırsatlar, ve bir orta boy bir göç. Ana bileşenler Django, MySQL ve özel analiz araçları çok sayıda ağır olan python ve java ile yazılmış kaldırma. Aynı makine Apache de çalışıyor.

Veri modeli aşağıdaki gibi görünüyor - büyük miktarda gerçek zamanlı veri gelir akışı çeşitli ağ sensörleri, ve ideal olarak, isterim kurmak uzun-anket yaklaşım yerine mevcut anket her 15 dakikada bir yaklaşım (bir sınırlama hesaplama istatistikleri ve yazımına veritabanı). Veri geldiğinde, raw versiyonu deposu MySQL, analiz araçları bu verilerin serbest bırak ve bir kaç tablolarda saklamak istatistikleri. Bu Django kullanarak işlenir.

İhtiyacım olacak ilişkisel özellikler

  • Emriyle[Cassandra'nın API SliceRange bu satisy gibi görünüyor]
  • Grup tarafından
  • Çoklu tablolar arasında ilişkiler Manytomany[Cassandra SuperColumns iyi bir çoğu için öyle görünüyor]
  • Bu Sfenks bana güzel bir tam metin motoru verir, bu yüzden de bir zorunluluk bu.[Cassandra, Lucandra proje bu ihtiyacı karşılayacak gibi görünüyor]

Benim büyük bir sorun veri çok yavaş ve sıcak ya da değil, yazar) okur. Para ve donanım şu anda çok fazla atmak istemiyorum, ve kolayca zaman ölçeği bir şey tercih ederim. Dikey olarak MySQL Ölçekleme mantıklı (veya) daha önemsiz değildir.

Aslında, NOSQL hakkında çok şey okudum ve MongoDB, Cassandra ve Voldemort gibi şeyleri tecrübe ettikten sonra, benim soru yani

  • Orta EC2 örneğiCassandra gibi bir şey kaydırarak yazar/okur herhangi bir yarar elde eder? This article (pdf) kesinlikle izlenimini veriyor. Şu anda, birkaç yüz dakika norm olur başına yazar diyebilirim. Okur - bu veri 5 dakikaya kadar her değişiklik bu yana, önbellek iptal olmasını oldukça hızlı. Bir noktada, eşzamanlı kullanıcı çok sayıda işlemek mümkün olmalıdır. Uygulama performans şu anda MySQL eğer bazı dizinler oluşturulur bile büyük tablolarda katıldı yapmaya öldürülüyor - 32 k satırların sırasını bir şey bir dakikadan fazla işlemek için alır. (Bu, O)/EC2 sanal bir obje olabilir. Tablo boyutu 4-5 milyon satır civarında ve yaklaşık 5 böyle bir tablo var.

  • Herkes CAP teoremi ve nihai yoğunluğuna bakılırsa birden çok düğüm üzerinde Cassandra kullanarak konuşuyor. Ama, sadece büyümeye başlayan bir proje içinmantıklı mı bir düğüm cassandra sunucusuna dağıtmak için? Herhangi bir uyarı var mı? Örneğin, Django için bir arka uç olarak MySQL yerine geçebilir? [Bu tavsiye?]

  • Eğer shift yaparsam, uygulama parçaları yapmak için yeniden yazmak çok daha alırım diye tahmin ediyorum "administrivia birden fazla aramaları almak için yapmak zorunda kalırım beri" satır.

  • Herhangi bir anlamda sadece anahtar değer bir mağaza olarak MySQL kullanmak için iyi olurduyerine ilişkisel bir motor, ve bu ile gitmek? Bu şekilde istikrarlı bir API mevcut çok sayıda, hem de istikrarlı bir motor (ve gerektiği gibi ilişkisel) kullanmak olabilir. (Bu konuda Google dan Taylor'ın sonrası http://bret.appspot.com/entry/how-friendfeed-uses-mysql) Brett

Vardiya yapmış insanlardan herhangi bir anlayış büyük mutluluk duyacağız!

Teşekkürler.

CEVAP
25 ŞUBAT 2010, PERŞEMBE


Cassandra ve diğer dağıtılmış veritabanları bugün mevcut ad-hoc sorgu desteği sql için kullanılan bir tür sağlar. Bu sorgu ile performantly katılır, vurgu denormalization kadar yerine dağıtabilirsiniz.

Ancak, Cassandra 0.6 (beta resmi olarak yarın, ama yapı 0,6 şube Kendin olsan sabırsız) destekler Hadoop map/azaltmak için analytics, aslında göründüğü gibi iyi bir fit için.

Cassandra yeni düğümleri acısız, hatta bir ilk bir gruba eklemek için mükemmel destek sağlar.

O, birkaç yüz/dakika yazar uzun, uzun bir zaman için mysql iyi olacaksın dedi. Cassandra anahtar/değer deposu olmaktan çok daha iyidir (daha iyi, anahtar/columnfamily) ama MySQL ilişkisel bir veritabanı olmaktan çok daha iyidir. :)

Henüz Cassandra için django desteği (veya başka bir nosql veri tabanı) yoktur. Ama pycon de django geliştiriciler için konuşmaya göre 1.2, bir sonraki sürümü için bir şeyler konuşuyorlar, kimse aslında henüz onun nasıl görüneceğini emin olabilirsiniz.

Bunu Paylaş:
  • Google+
  • E-Posta
Etiketler:

YORUMLAR

SPONSOR VİDEO

Rastgele Yazarlar

  • iNCH

    iNCH

    20 Temmuz 2009
  • MattSteffanina 2

    MattSteffani

    28 Kasım 2007
  • National Geographic

    National Geo

    7 Mayıs 2006