SORU
21 NİSAN 2009, Salı


Nasıl sözcük Dallanma veya Lemmatization yapmalıyım?

PorterStemmer ve Kartopu denedim ama hem tüm sözcükleri, oldukça yaygın olanları eksik çalışmıyor.

Benim test kelimeler: "çalışan kediler kaktüs kaktüsler kaktüsler topluluk topluluklar koştu"ve her ikisi de almak yarısından daha az.

Ayrıca Bkz:

CEVAP
3 Mayıs 2009, Pazar


Eğer Python biliyorsanız, Natural Language Toolkit (NLTK) WordNet kullanan çok güçlü bir lemmatizer vardır.

Bu gibi çalışır:

>>> from nltk.stem.wordnet import WordNetLemmatizer
>>> lmtzr = WordNetLemmatizer()
>>> lmtzr.lemmatize('cars')
'car'
>>> lmtzr.lemmatize('feet')
'foot'
>>> lmtzr.lemmatize('people')
'people'
>>> lmtzr.lemmatize('fantasized','v')
'fantasize'

nltk.stem module diğer lemmatizers var ama kendim denemedim.

Bunu Paylaş:
  • Google+
  • E-Posta
Etiketler:

YORUMLAR

SPONSOR VİDEO

Rastgele Yazarlar

  • Caramthros

    Caramthros

    10 AĞUSTOS 2007
  • Evan Coury

    Evan Coury

    29 NİSAN 2007
  • Peter Sharp

    Peter Sharp

    11 ŞUBAT 2013