SORU
12 NİSAN 2011, Salı


Nasıl jsoup düz metin html dönüştürmek için kullanırken satır sonlarını korumak mı?

Aşağıdaki kodu var:

   public class NewClass {
        public String noTags(String str){
            return Jsoup.parse(str).text();
        }


      public static void main(String args[]) {
       String strings="<!DOCTYPE HTML PUBLIC \"-//W3C//DTD HTML 4.0 Transitional//EN \">"  
        "<HTML> <HEAD> <TITLE></TITLE> <style>body{ font-size: 12px;font-family: verdana, arial, helvetica, sans-serif;}</style> </HEAD> <BODY><p><b>hello world</b></p><p><br><b>yo</b> <a href=\"http://google.com\">googlez</a></p></BODY> </HTML> ";
  NewClass text = new NewClass();
      System.out.println((text.noTags(strings)));


}

Ve sonuç var:

hello world yo googlez

Ama satır sonu eklemek istiyorum:

hello world
yo googlez

jsoup's TextNode#getWholeText() baktım ama nasıl kullanılacağını çözemedim.

Eğer <br> işaretleme ben bir ayrıştırma ise, nasıl bir sonuç benim çıkış hattı Ara verebilir miyim?

CEVAP
17 Mayıs 2011, Salı


İle

Jsoup.parse("A\nB").text();

çıkış var

"A B" 

değil

A

B

Bunun için kullanıyorum:

text = Jsoup.parse(html.replaceAll("(?i)<br[^>]*>", "br2n")).text();
text = descrizione.replaceAll("br2n", "\n");

Bunu Paylaş:
  • Google+
  • E-Posta
Etiketler:

YORUMLAR

SPONSOR VİDEO

Rastgele Yazarlar

  • hydejiaqi

    hydejiaqi

    12 Mart 2008
  • infiniTuts

    infiniTuts

    18 Ocak 2012
  • Wild Academy

    Wild Academy

    8 Aralık 2009