Nasıl Apple e-postaları Tarih, Saat ve adresi buluyor?
İçinde iOS e-posta istemcisi, e-posta içeren bir tarih, zaman ve mekan, metni olur ve bir köprü oluşturmak mümkündür randevu ya bak bir harita sadece dokunarak bağlantı. Sadece İngilizce e-postalar için çalışır, ama diğer dillerde de. Bu özelliğini çok seviyorum ve bunu nasıl yaptıklarını anlamak istiyorum.
Bunu yapmak için de naif bir şekilde çok düzenli ifadeler var ve hepsini çalışır. Ancak ben bunu çok iyi ölçek için gitmiyor ve sadece belirli bir dil veya bir tarih biçimi, vb için çalışacak. Bence bu Apple olmalı bazı fikirlerini kullanarak makine öğrenme özü varlıkları (8:00, akşam saat 8, 8:00, 0800, 20:00, 20 H, 20h00, 2000 vb.).
Apple varlıkları çok hızlı bir şekilde e-posta istemcisi ayıklamak için mümkün olduğu kadar uzun bir fikriniz var mı? Ne makine öğrenme algoritması gerçekleştirmek gibi görev uygulamak ister misiniz?
CEVAP
Büyük olasılıkla bunun için Information Extraction tekniklerini kullanır.
İşte Stanford SUTime aracı bir gösteri:
http://nlp.stanford.edu:8080/sutime/process
Bir belge içinde n-gram hakkında öznitelikleri (ardışık kelimeler) özü:
- numberOfLetters
- numberOfSymbols
- uzunluğu
- previousWord
- nextWord
- nextWordNumberOfSymbols
...
Ve sonra bir sınıflandırma algoritması kullanın, ve onu beslemek olumlu ve olumsuz örnekler:
Observation nLetters nSymbols length prevWord nextWord isPartOfDate
"Feb." 3 1 4 "Wed" "29th" TRUE
"DEC" 3 0 3 "company" "went" FALSE
...
Her 50 örnekler ile alabilirsiniz, ama daha neşeli. Daha sonra algoritma bu örneklere dayalı öğrenir, ve daha önce görmedi ki gelecek örnekler için geçerli olabilir.
Kural olarak bilgi alabilir
- bir önceki kelime tek karakter belki de... dönemleri
- ve geçerli kelime "Şubat", "Mart.", "" ...
- ve kelime içinde bir sonraki "", any_number ... . onikinci
- o zaman tarih
Burada konu ile ilgili Google Mühendisi tarafından decent video
Nasıl Java UTC veya GMT geçerli tarih ...
Nasıl geçerli tarih java/saat almak...
C tarih saat kısmını kaldırmak nasıl# ...
Nasıl Android tarih ve saat biçimi mus...
Nasıl iki Tarih saat bölümü olmadan ka...