SORU
28 HAZİRAN 2009, Pazar


Çok büyük matrislerin ve Python NumPy kullanarak

NumPy son derece yararlı kütüphane ve kullanarak bunu buldum bu işi idare etmekte olan matrislerin oldukça büyük (10000 x 10000) kolay, ama başlar mücadele ile çok daha büyük bir şey arıyorum oluşturmak için bir matris 50000 x 50000 başarısız). Belli ki, bu büyük bellek gereksinimleri nedeniyle.

Büyük bir matris oluşturmak için bir şekilde bir yolunu NumPy (1 milyon ile 1 milyon diyelim) ve doğal olarak (RAM birkaç terrabytes olmadan) var mı?

CEVAP
30 HAZİRAN 2009, Salı


PyTables ve NumPy gitmek için bir yoldur.

PyTables isteğe bağlı sıkıştırma ile CTA biçimde diskteki verileri saklar. Benim veri setleri genellikle on ya da yüz milyonlarca satır ile uğraşırken kullanışlı olan 10x sıkıştırma. Ayrıca çok hızlı değil; benim 5 yaşındaki laptop data SQL-1,000,000 satır/saniye, toplama GRUP yaparak crunch. Kötü bir Python tabanlı bir çözüm değil!

NumPy bir recarray olarak tekrar veri erişim Basit olarak

data = table[row_from:row_to]

CTA kütüphane veri ilgili bölümleri okuma ve NumPy dönüştürme ilgilenir.

Bunu Paylaş:
  • Google+
  • E-Posta
Etiketler:

YORUMLAR

SPONSOR VİDEO

Rastgele Yazarlar

  • Jimmie Jones

    Jimmie Jones

    16 Kasım 2007
  • pain975

    pain975

    27 NİSAN 2008
  • Photoshop Training Channel

    Photoshop Tr

    13 Temmuz 2012