SORU
21 NİSAN 2009, Salı


Nasıl sözcük Dallanma veya Lemmatization yapmalıyım?

PorterStemmer ve Kartopu denedim ama hem tüm sözcükleri, oldukça yaygın olanları eksik çalışmıyor.

Benim test kelimeler: "çalışan kediler kaktüs kaktüsler kaktüsler topluluk topluluklar koştu"ve her ikisi de almak yarısından daha az.

Ayrıca Bkz:

CEVAP
3 Mayıs 2009, Pazar


Eğer Python biliyorsanız, Natural Language Toolkit (NLTK) WordNet kullanan çok güçlü bir lemmatizer vardır.

Bu gibi çalışır:

>>> from nltk.stem.wordnet import WordNetLemmatizer
>>> lmtzr = WordNetLemmatizer()
>>> lmtzr.lemmatize('cars')
'car'
>>> lmtzr.lemmatize('feet')
'foot'
>>> lmtzr.lemmatize('people')
'people'
>>> lmtzr.lemmatize('fantasized','v')
'fantasize'

nltk.stem module diğer lemmatizers var ama kendim denemedim.

Bunu Paylaş:
  • Google+
  • E-Posta
Etiketler:

YORUMLAR

SPONSOR VİDEO

Rastgele Yazarlar

  • FPSRussia

    FPSRussia

    19 NİSAN 2010
  • iBand IguJoo

    iBand IguJoo

    25 AĞUSTOS 2006
  • megablueblaster

    megablueblas

    23 HAZİRAN 2006