Nasıl Apple hakkında tweetler ayırt etmek için bir model (Inc.) oluşturabilirsiniz apple hakkında tweetler (meyve)?
Aşağıda "apple." 50 Tweet için bakın El pozitif Apple Inc hakkında maçlar etiketli var. Aşağıda 1 olarak işaretlenmiş.
İşte birkaç satır:
1|“@chrisgilmer: Apple targets big business with new iOS 7 features http://bit.ly/15F9JeF ”. Finally.. A corp iTunes account!
0|“@Zach_Paull: When did green skittles change from lime to green apple? #notafan” @Skittles
1|@dtfcdvEric: @MaroneyFan11 apple inc is searching for people to help and tryout all their upcoming tablet within our own net page No.
0|@STFUTimothy have you tried apple pie shine?
1|#SuryaRay #India Microsoft to bring Xbox and PC games to Apple, Android phones: Report: Microsoft Corp... http://dlvr.it/3YvbQx @SuryaRay
Burada toplam veri seti: http://pastebin.com/eJuEb4eB
"" (Inc). Apple sınıflandırır bir model oluşturmak için ihtiyacım var diğerlerinden.
Makine öğrenmesine genel bir bakış aramıyorum, kodu (Python tercih edilen) gerçek model arıyorum daha doğrusu.
CEVAP
Aradığınızı Named Entity Recognition denir. (En sık) Conditional Random Fields varlıklar, varlıklar hakkında bir şeyler öğrenmek için eğitilmiş olması için temel adlı bulmak için kullanan istatistiksel bir tekniktir.
Aslında, içeriği de görünüyorbağlamkelime, (geri ve ileri bir kaç kelime arıyorum), kelime adında bir varlık olma olasılığını tahmin etmek için.
İyi bir yazılım sözcüklerin diğer özellikleri, uzunluğu veya şekil gibi bakar ("ile başlar" "Sesli harf-sessiz harf-sesli harf") . Vcv gibi
Çok iyi bir kütüphanesi (GPL) Stanford's NER
Burada demo: http://nlp.stanford.edu:8080/ner/
Örnek metin denemek için:
Bir apple genel merkezinde yemek ve düşündüm ben Apple Martin, Coldplay adamın kızı
(3class ve 4class doğru) sınıflandırıcılar
Nasıl geçmişi ile tarihi değişiklikler...
Nasıl şifreli bir Apple şifresini çözm...
Nasıl Apple iPhone ile UİKeyboard boyu...
Nasıl Apple KİMLİĞİ, bileşenleri yükle...
Nasıl yeni bir Apple KİMLİĞİ ile Günce...