SORU
2 Aralık 2009, ÇARŞAMBA


Stanford NLP Java: Part Konuşmanın etiketler?

Stanford NLP, demo *4 ... * böyle bir çıktı verir:

Colorless/JJ green/JJ ideas/NNS sleep/VBP furiously/RB ./.

Konuşma etiketler Kısmı ne demek? Resmi bir liste bulamadım. Stanford kendi sistemi mi, yoksa evrensel etiketleri kullanıyorlar? (Örneğin JJ,?)

Cümleler üzerinden, isimler arıyor yineleme olduğum zaman da, mesela, tag 3 ** eğer görmek için kontrol gibi şeyler yapmak zorunda kalacağım. Bu çok zayıf hissediyor. Konuşma belirli bir parçası için program aracılığıyla arama yapmak için daha iyi bir yolu var mı?

CEVAP
2 Aralık 2009, ÇARŞAMBA


The Penn Treebank Project. Part-of-speech tagging ps bak.

JJ sıfat. SA isim, çoğul. VBP fiil şimdiki zaman. RB belirteçtir.

İngilizce için. Çin için, Çin Penn ağaç yapılı. Ve Almanca için NEGRA corpus.

  1. Koordine bağlaç CC
  2. CD Kardinal sayı
  3. DT Belirleyici
  4. ESKİ Varoluşsal var
  5. Yabancı kelime FW
  6. Edat veya uydurduğu birlikte
  7. JJ Sıfat
  8. JJR Sıfat, karşılaştırmalı
  9. JJS Sıfat, üstün
  10. LS kalemi marker Listesi
  11. MD Kalıcı
  12. NN İsim, tekil ya da toplu
  13. SA İsim, çoğul
  14. Sıfat, tekil NNP
  15. NNPS Uygun isim, çoğul
  16. PST Predeterminer
  17. POS biten İyelik
  18. Kişisel zamir PRP
  19. $ PRP İyelik zamiri
  20. RB Zarf
  21. RBR Zarf, karşılaştırmalı
  22. RBS Zarf, üstün
  23. RP Parçacık
  24. SYM Sembolü
  25. İçin İÇİN
  26. AH Ünlemi
  27. VB Fiil, temel formu
  28. VBD Fiil, geçmiş zaman
  29. VBG Fiil, isim fiilinin çekiminin yapılması veya mevcut sıfat
  30. VBN Fiil, geçmiş zaman
  31. VBP, non3rd tekil şahıs Fiil mevcut
  32. 3. Fiil tekil şahıs şimdiki VBZ
  33. WDT Whdeterminer
  34. WP Whpronoun
  35. $ İyelik WP whpronoun
  36. DRB Whadverb

Bunu Paylaş:
  • Google+
  • E-Posta
Etiketler:

YORUMLAR

SPONSOR VİDEO

Rastgele Yazarlar

  • 2ndfloor91

    2ndfloor91

    17 Kasım 2007
  • njhaley

    njhaley

    24 NİSAN 2006
  • ThisWeekYT

    ThisWeekYT

    14 Mart 2013