SORU
8 NİSAN 2009, ÇARŞAMBA


Nasıl C Metin için HTML Dönüştürme#?

C arıyorum# kodunu düz metin için bir HTML belgesi dönüştürmek için.

Basit etiket sıyırma , ama düz metin ile bir çıkış olacak bir şey aramıyorummakulorijinal düzeni koruma.

Çıkış bu gibi görünmelidir:

Html2Txt at W3C

HTML Çeviklik Paketi de baktım, ama o benim neye ihtiyacım olduğunu sanmıyorum. Herkes başka bir öneriniz var mı?

DÜZENLEME:Ben sadece CodePlex, HTML Çeviklik Paketi indir ve Html2Txt proje koştu. Ne bir hayal kırıklığı (metin dönüştürme html yapar en azından modülü)! Yaptığı tüm etiketleri şerit, tablolar, vb dümdüz oldu. Çıkış Html2Txt @ W3C üretilen gibi bir şey görünmüyordu. Çok kötü bu kaynak kullanılabilir olması için görünmüyor. Eğer daha fazla "" çözüm mevcuttur. konserve ise orada görmek istiyordum

EDİT 2:Sizin önerileriniz için herkese teşekkür ederim.Adware.Adserviceyönünde uyardı beni gitmek istedim. "Dökümü" standart çıktıya metin göndermek ve ProcessStartInfo.UseShellExecute = false ProcessStartInfo.RedirectStandardOutput = true ile stdout yakalama geçin. lynx.exe çalıştırmak için System.Diagnostics.Process sınıf kullanabilirim C tüm bitiriyorum# sınıf. Bu kod bunu yapıyor vs yeni bir süreç yumurtlama hakkında çok endişeli değilim bu yüzden sadece occassionly adı verilecek. Vaşaklar çok HIZLI!! artı

CEVAP
8 NİSAN 2009, ÇARŞAMBA


Bu, HTML ayrıştırma yapıyorsun eğer güvenilir bir kaynaktan duydum .Net, HTML bakmalısın çeviklik paketi tekrar..

http://www.codeplex.com/htmlagilitypack

YANİ.. biraz örnek

http://stackoverflow.com/questions/655603/html-agility-pack-parsing-tables

Bunu Paylaş:
  • Google+
  • E-Posta
Etiketler:

YORUMLAR

SPONSOR VİDEO

Rastgele Yazarlar

  • Dom Esposito

    Dom Esposito

    26 Mayıs 2011
  • jagadambarecords

    jagadambarec

    13 AĞUSTOS 2008
  • The Verge

    The Verge

    8 AĞUSTOS 2006