SORU
6 ŞUBAT 2011, Pazar


Python sabit genişlik dosyaları ayrıştırma verimli şekilde

Sabit genişlik hatları tutan ayrıştırma dosyaları etkili bir yol bulmak için çalışıyorum. İlk 20 karakter bir sütun, 21:30 da başka bir temsil. örnek: Hadi hattı 100 karakter tutar varsayalım. Çeşitli bileşenleri içine bir satır ayrıştırmak için etkili bir yol ne olabilir?

String satır başına Dilimleme kullanabilirim, ama çirkin eğer çizgi büyük ... diğer hızlı yöntem ise biraz?

CEVAP
6 ŞUBAT 2011, Pazar


Eğer bu etkili olduğundan emin değilim, ama okunabilir Dilimleme elle yapmak yerine) olmalıdır. Bir dize ve sütun uzunlukları alır, ve bu nedenle döndüren bir fonksiyon slices tanımlanmış. Bir jeneratör yaptım, çok uzun satırlar, dizeleri geçici bir liste oluşturmak değil.

def slices(s, *args):
    position = 0
    for length in args:
        yield s[position:position   length]
        position  = length

Örnek

In [32]: list(slices('abcdefghijklmnopqrstuvwxyz0123456789', 2))
Out[32]: ['ab']

In [33]: list(slices('abcdefghijklmnopqrstuvwxyz0123456789', 2, 10, 50))
Out[33]: ['ab', 'cdefghijkl', 'mnopqrstuvwxyz0123456789']

In [51]: d,c,h = slices('dogcathouse', 3, 3, 5)
In [52]: d,c,h
Out[52]: ('dog', 'cat', 'house')

Ama bir jeneratör avantajı, eğer tüm sütunları aynı anda ihtiyacın olursa kayıp olduğunu düşünüyorum. Tek tek sütunlar üzerinde işlem yapmak istediğiniz zaman size bir yarar olabilir, bir döngü demek.

Bunu Paylaş:
  • Google+
  • E-Posta
Etiketler:

YORUMLAR

SPONSOR VİDEO

Rastgele Yazarlar

  • amc

    amc

    21 EYLÜL 2005
  • Christopher Bill

    Christopher

    30 NİSAN 2009
  • TotalxLuna

    TotalxLuna

    27 Kasım 2011