SORU
21 NİSAN 2009, Salı


Nasıl sözcük Dallanma veya Lemmatization yapmalıyım?

PorterStemmer ve Kartopu denedim ama hem tüm sözcükleri, oldukça yaygın olanları eksik çalışmıyor.

Benim test kelimeler: "çalışan kediler kaktüs kaktüsler kaktüsler topluluk topluluklar koştu"ve her ikisi de almak yarısından daha az.

Ayrıca Bkz:

CEVAP
3 Mayıs 2009, Pazar


Eğer Python biliyorsanız, Natural Language Toolkit (NLTK) WordNet kullanan çok güçlü bir lemmatizer vardır.

Bu gibi çalışır:

>>> from nltk.stem.wordnet import WordNetLemmatizer
>>> lmtzr = WordNetLemmatizer()
>>> lmtzr.lemmatize('cars')
'car'
>>> lmtzr.lemmatize('feet')
'foot'
>>> lmtzr.lemmatize('people')
'people'
>>> lmtzr.lemmatize('fantasized','v')
'fantasize'

nltk.stem module diğer lemmatizers var ama kendim denemedim.

Bunu Paylaş:
  • Google+
  • E-Posta
Etiketler:

YORUMLAR

SPONSOR VİDEO

Rastgele Yazarlar

  • Benjamin Heckendorn

    Benjamin Hec

    4 Mayıs 2008
  • Tek Syndicate

    Tek Syndicat

    23 Temmuz 2008
  • thewinekone

    thewinekone

    17 Aralık 2005