SORU
16 HAZİRAN 2010, ÇARŞAMBA


R sıkıştırılmış veri dosyası indirmek için kullanarak, ayıklamak ve veri alma

@Yazar:Twitter EZGraphs "Online csvs çok sıkıştırılmış. Bir şekilde indirmek, arşiv ayıklayın ve bir veri için veri yüklemek için vardır.R kullanarak çerçeve? #Rstats"

Ayrıca Bunu bugün yapmaya çalışıyordum, ama sadece manuel olarak zip dosya indirme sona erdi.

Gibi bir şey denedim:

fileName <- "http://www.newcl.org/data/zipfiles/a1.zip"
con1 <- unz(fileName, filename="a1.dat", open = "r")

ama eğer uzun bir yol gidiyorum gibi hissediyorum. Herhangi bir düşünce?

CEVAP
16 HAZİRAN 2010, ÇARŞAMBA


Arşivler aslında daha 'dosya' ile içerik meta vb. Zip Ayrıntılar için help(unzip) bkz. Gerek yukarıda dışarı kroki ne yapacak o kadar

  1. Geçici oluşturun. isim (tempfile() gibi) dosya
  2. download.file() temp içine dosyasını almak için kullanın. dosya
  3. unz() temp hedef dosya ayıklamak için kullanın. dosya
  4. unlink()) temp dosyasını Kaldır

kod (teşekkürler temel örneğin, ama bu daha basit gibi görünüyor

temp <- tempfile()
download.file("http://www.newcl.org/data/zipfiles/a1.zip",temp)
data <- read.table(unz(temp, "a1.dat"))
unlink(temp)

Sıkıştırılmış (.z) veya gzip ' (.gz) veya bzip2ed (.bz2) dosyalardırsadece dosyave bu doğrudan bir bağlantıdan okuyabilirsiniz. Yani bunun yerine kullanın:) veri sağlayıcısı

Bunu Paylaş:
  • Google+
  • E-Posta
Etiketler:

YORUMLAR

SPONSOR VİDEO

Rastgele Yazarlar

  • Matthew Pearce

    Matthew Pear

    9 AĞUSTOS 2009
  • Michael Neal

    Michael Neal

    2 Mayıs 2009
  • THE RED DRAGON

    THE RED DRAG

    6 ŞUBAT 2009