2 Aralık 2009, ÇARŞAMBA
Stanford NLP Java: Part Konuşmanın etiketler?
Stanford NLP, demo *4 ... * böyle bir çıktı verir:
Colorless/JJ green/JJ ideas/NNS sleep/VBP furiously/RB ./.
Konuşma etiketler Kısmı ne demek? Resmi bir liste bulamadım. Stanford kendi sistemi mi, yoksa evrensel etiketleri kullanıyorlar? (Örneğin JJ
,?)
Cümleler üzerinden, isimler arıyor yineleme olduğum zaman da, mesela, tag 3 ** eğer görmek için kontrol gibi şeyler yapmak zorunda kalacağım. Bu çok zayıf hissediyor. Konuşma belirli bir parçası için program aracılığıyla arama yapmak için daha iyi bir yolu var mı?
CEVAP
2 Aralık 2009, ÇARŞAMBA
The Penn Treebank Project. Part-of-speech tagging ps bak.
JJ sıfat. SA isim, çoğul. VBP fiil şimdiki zaman. RB belirteçtir.
İngilizce için. Çin için, Çin Penn ağaç yapılı. Ve Almanca için NEGRA corpus.
- Koordine bağlaç CC
- CD Kardinal sayı
- DT Belirleyici
- ESKİ Varoluşsal var
- Yabancı kelime FW
- Edat veya uydurduğu birlikte
- JJ Sıfat
- JJR Sıfat, karşılaştırmalı
- JJS Sıfat, üstün
- LS kalemi marker Listesi
- MD Kalıcı
- NN İsim, tekil ya da toplu
- SA İsim, çoğul
- Sıfat, tekil NNP
- NNPS Uygun isim, çoğul
- PST Predeterminer
- POS biten İyelik
- Kişisel zamir PRP
- $ PRP İyelik zamiri
- RB Zarf
- RBR Zarf, karşılaştırmalı
- RBS Zarf, üstün
- RP Parçacık
- SYM Sembolü
- İçin İÇİN
- AH Ünlemi
- VB Fiil, temel formu
- VBD Fiil, geçmiş zaman
- VBG Fiil, isim fiilinin çekiminin yapılması veya mevcut sıfat
- VBN Fiil, geçmiş zaman
- VBP, non3rd tekil şahıs Fiil mevcut
- 3. Fiil tekil şahıs şimdiki VBZ
- WDT Whdeterminer
- WP Whpronoun
- $ İyelik WP whpronoun
- DRB Whadverb
Bunu Paylaş:
Nasıl Java kod bazı bölümleri için Ecl...
Java çift tilde anlamı ( ~ ~ )?...
URL Java sınıf kaynakları yüklemek içi...
6 vs Java SE TOTEM 1.6 vs 1.6 - bu da ...
GetClass aramak için nasıl() Java'da s...