SORU
16 HAZİRAN 2009, Salı


Ruby doğal Dil İşleme

Bazı cümle analizi (çoğunlukla twitter uygulamaları için) ve bazı genel özellikleri anlaması için arıyorum. İyi bir doğal dil Ruby bu tür bir şey için kütüphaneler işlem var mı?

Ruby http://stackoverflow.com/questions/870460/java-is-there-a-good-natural-language-processing-library ama benzer. Çok genel birşeyler tercih ederim, ama herhangi bir ipucu takdir edilir!

CEVAP
7 NİSAN 2012, CUMARTESİ


Mükemmel ve olgun üç NLP paketleri Stanford Core NLP, Open NLP LingPipe. Stanford Core NLP araçları Ruby bağlamaları (GPL lisansı) yanı sıra OpenNLP araçlar (Apache Lisans) vardır.

İşler daha deneysel tarafında, Ruby için var hemen hemen her NLP ile ilgili gem için ortak bir API sağlar Text Retrieval, Extraction and Annotation Toolkit (Tedavi), GPL lisansı, korumak. Tedavi özellikleri aşağıdaki listede de istikrarlı doğal dil işleme taşlar açısından iyi bir referans Ruby 1.9 ile uyumlu olarak hizmet verebilir.

  • Metin çeviri ve tokenizers (punkt-segmenter, tactful_tokenizer, , *srx-english*3)
  • Doğal dil İngilizce, Fransızca ve Almanca için ayrıştırıcıları ve İngilizce için özellik çıkarımı (stanford-core-nlp) adlı.
  • Kelime türetme ve fiil çekimi (linguistics), doğan (*6, *, lingua, **7 vb.)
  • WordNet arabirimi (rwordnet), POS sprey boyacılardan (rbtagger, engtagger, vb.)
  • Dil (whatlanguage), tarih/saat (chronic, , *kronic*15), anahtar kelime (lda-ruby) çıkarma.
  • İndeksleme ve tam metin arama (ferret) ile metin alma.
  • Özellik çıkarımı (stanford-core-nlp) adlı.
  • Makine öğrenme, karar ağaçları (decisiontree), MLPs (ruby-fann), SVMs (rb-libsvm) ve doğrusal sınıflandırma temel (tomz-liblinear-ruby-swig).
  • Metin benzerlik ölçümleri (levenshtein-ffi, , *fuzzy-string-match*25).

Tedavi almayan, ancak ilgili için NLP: hotwater (string mesafe algoritmaları), 34* *(Apache için bağlayıcı okumak için Tiki .doktor, .docx, .sayfalar .odt, .rtf, .pdf), graph-rank (GraphRank bir uygulama).

Bunu Paylaş:
  • Google+
  • E-Posta
Etiketler:

YORUMLAR

SPONSOR VİDEO

Rastgele Yazarlar

  • amc

    amc

    21 EYLÜL 2005
  • PlayStation

    PlayStation

    16 Aralık 2005
  • stewmurray47

    stewmurray47

    1 Kasım 2006