SORU
21 NİSAN 2009, Salı


Nasıl sözcük Dallanma veya Lemmatization yapmalıyım?

PorterStemmer ve Kartopu denedim ama hem tüm sözcükleri, oldukça yaygın olanları eksik çalışmıyor.

Benim test kelimeler: "çalışan kediler kaktüs kaktüsler kaktüsler topluluk topluluklar koştu"ve her ikisi de almak yarısından daha az.

Ayrıca Bkz:

CEVAP
3 Mayıs 2009, Pazar


Eğer Python biliyorsanız, Natural Language Toolkit (NLTK) WordNet kullanan çok güçlü bir lemmatizer vardır.

Bu gibi çalışır:

>>> from nltk.stem.wordnet import WordNetLemmatizer
>>> lmtzr = WordNetLemmatizer()
>>> lmtzr.lemmatize('cars')
'car'
>>> lmtzr.lemmatize('feet')
'foot'
>>> lmtzr.lemmatize('people')
'people'
>>> lmtzr.lemmatize('fantasized','v')
'fantasize'

nltk.stem module diğer lemmatizers var ama kendim denemedim.

Bunu Paylaş:
  • Google+
  • E-Posta
Etiketler:

YORUMLAR

SPONSOR VİDEO

Rastgele Yazarlar

  • guau . .

    guau . .

    25 Ocak 2008
  • hockeywebcasts

    hockeywebcas

    31 EKİM 2012
  • MrOctopi

    MrOctopi

    6 Aralık 2010