SORU
28 HAZİRAN 2009, Pazar


Çok büyük matrislerin ve Python NumPy kullanarak

NumPy son derece yararlı kütüphane ve kullanarak bunu buldum bu işi idare etmekte olan matrislerin oldukça büyük (10000 x 10000) kolay, ama başlar mücadele ile çok daha büyük bir şey arıyorum oluşturmak için bir matris 50000 x 50000 başarısız). Belli ki, bu büyük bellek gereksinimleri nedeniyle.

Büyük bir matris oluşturmak için bir şekilde bir yolunu NumPy (1 milyon ile 1 milyon diyelim) ve doğal olarak (RAM birkaç terrabytes olmadan) var mı?

CEVAP
30 HAZİRAN 2009, Salı


PyTables ve NumPy gitmek için bir yoldur.

PyTables isteğe bağlı sıkıştırma ile CTA biçimde diskteki verileri saklar. Benim veri setleri genellikle on ya da yüz milyonlarca satır ile uğraşırken kullanışlı olan 10x sıkıştırma. Ayrıca çok hızlı değil; benim 5 yaşındaki laptop data SQL-1,000,000 satır/saniye, toplama GRUP yaparak crunch. Kötü bir Python tabanlı bir çözüm değil!

NumPy bir recarray olarak tekrar veri erişim Basit olarak

data = table[row_from:row_to]

CTA kütüphane veri ilgili bölümleri okuma ve NumPy dönüştürme ilgilenir.

Bunu Paylaş:
  • Google+
  • E-Posta
Etiketler:

YORUMLAR

SPONSOR VİDEO

Rastgele Yazarlar

  • DetroitBORG

    DetroitBORG

    29 Temmuz 2008
  • Jay Will

    Jay Will

    19 NİSAN 2006
  • Matus Slovak

    Matus Slovak

    5 Temmuz 2007