Ayrıştırma alıntı cevap e-posta içeriği
Vardır diye herhangi bir alıntı Cevapla metin bir e-posta metnini ayrıştırmak için nasıl anlamaya çalışıyorum. Genellikle e-posta istemcileri "tarih" ya da köşeli parantez ile. satırları yazdığı bir önek koyacağız fark ettim Ne yazık ki, herkes bunu yapar. Herkes hakkında bir fikriniz var Program aracılığıyla metin cevap algılıyor mu? C kullanıyorum# bu ayrıştırıcı yazmak için.
CEVAP
Bu arama daha yaptım ve burada ne buldum. Tüm konu varken ve yokken. temelde bu yaptığınız iki durum vardır: Bu iki kategoriye kırarım:
Konu sen olduğunda:
Eğer e-posta tüm seri varsa, kaldırma aslında size ne alıntı metin olduğunu güvence çok yüksek düzeyde elde edebilirsiniz. Bunu yapmak için iki yol vardır. Bir ileti, ileti-KİMLİĞİ, Yanıtlama KİMLİĞİ ve İplik-Dizin tek tek mesaj sayısını belirlemek için kullanabilirsiniz, üst ve ait olduğu iş parçacığı. Bu konuda daha fazla bilgi için*, RFC2822, this interesting article on threading*0, veya this article on threading bkz. Yeniden monte iplik varsa, o zaman bir dış metin kaldırabilirsiniz (İçin, CC, vb... çizgiler gibi) ve bitirdiniz.
Eğer birlikte çalıştığınız mesajlar başlıkları var olmasa da benzerlik eşleşen bir e-posta parçalarını cevap metni belirlemek için kullanabilirsiniz. Bu durumda benzerlik eşleşen tekrarlanan metni belirlemek için yapmaya mecbursunuz. Bu durumda this one on Code Project this one Levenshtein Distance algorithm içine bakmak isteyebilirsiniz.
Eğer diş çekme işlemi ilgileniyorsanız eğer, this great PDF on reassembling email threads kontrol et ne olursa olsun.
Konu yok:
Eğer konu sadece bir mesaj ile sıkışmış, teklif ne olduğunu tahmin etmek denemek için yapıyorsun. Bu durumda, burada farklı tırnak yöntem gördüm:
- bir çizgi outlook görüldüğü gibi).
- Köşeli Parantez
- "---Özgün İleti---"
- "Bu tür-ve-böyle bir günde, bu kadar çok ve yazdı:"
Oradan metin aşağı kaldırmak ve bitirdiniz. Bu herhangi bir eksisi hepsi Gönderen alıntılanan metnin üstüne dediler koyup internette eski stil gibi) bir boşluk olmadığını varsayıyorum. Eğer bu olursa, iyi şanslar. Bu sana biraz yardımcı olur umarım!
Nasıl metin dışında serbest sokak/post...
Grafik kullanıcı e-posta almak için na...
İframe genişlik yükseklik içeriği ile ...
Clojure XML Ayrıştırma...
Ayrıştırma HTML reStructuredText...