SORU
11 Kasım 2014, Salı


Tam metin arama için çalışmıyor Batılı olmayan Google Sites API diller

JavaEE uygulama, Atom tabanlı Google Sites API halka açık olmayan bir Google Site İçeriğini almak için kullanıyorum. Aslında, basit bir CMS olarak Google Sitesini kullanıyoruz, ve uygulama içinde API site İçeriğini çevrimiçi Yardım sistemi beslemek için almak için kullanın. Bir süre bu kurulum yaptım ve sorunsuz çalışıyor.

Sorunu

Benim uygulamada, tam metin çevrimiçi Yardım sistemi arama işlevselliği eklemek istiyorum. Bu özellik isteği bir noktada gel biliyordum, Google Sitelerinde benim ana içeriği için karar verirken, Siteler, API tam metin arama desteği olup olmadığını kontrol ettim. It does. Örneğin, aşağıdaki URL Tüm site sayfaları anahtar kelime user içeren my-site Arama.

https://sites.google.com/feeds/content/my.doma.in/my-site?q=user

Bu işleri, benden beklenen sonuç sayfaları verir. Ama bunu yaparBatı dillerinde yazılmış sadece içerikya da, daha spesifik olarak, hangi/kelimeler belirteçleri dilleri boşluk ve noktalama işaretleri ile ayrılır. Benim Japon içeriğine benzer bir arama çalıştırdığınızda, anahtar kelime arama 5**:

https://sites.google.com/feeds/content/my.doma.in/my-site?q=ユーザー

Sadece arama terimi çıplak bir dize olarak görünür sonuç sayfaları alacağım, yani boşluk ya ayrılmış ya da noktalama işareti. Japon dili scriptio continua yazılmış olduğu için bu yeterli değildir. İçeren sayfalar; örneğin:

ご自身のユーザー基本情報の確認

sonuçları. göstermez Perde arkasında kullanılan arama indeksi "Batı" sözlü kuralları ve Japon içeriği doğru tokenized değildir. göre oluşturulan öyle görünüyor Ben Google Site aynı anahtar kelime için arama, ancakBu site aramaalan, doğru sonuç alamadım. Sonucuna vardımdoğru tokenized bir dizin var, ama imkansız API tabanlı bir arama için kullanmak gibi görünüyor.

Ben şimdiye kadar denedim ne

Bu durumu düzeltmek için, bu şimdiye kadar keşfedilen ettik yollar vardır:

  • Google Siteleri kendi içinde dil ayarları aramaya çalıştım. Genel UI bir dil zaten Japon ayarlandı ve API sorgu sonuçları üzerinde etkisi olan ayarı yok. Dizin oluşturucu tokenizer eli/gücü için sayfa başına, ya başına bir şablon dil ayarları yok.
  • Çift tırnak ile arama dizesini ("ユーザー") alıntı denedim.
  • Joker karakterler (*ユーザー*) dahil denedim.
  • Diğer Google API genelinde görülen URL için ek dil parametreleri kullanarak denedim: lang, hl (dil), rl (sonuçlar dil),..
  • ** 15, ama imkansız da olmayan herkese açık bir Google Site üzerinde çalışmak gibi görünüyor bir Google oluşturmaya çalıştım.

Yani...

Hızlı fikirler burada bitiyor. En kötü durum senaryosu, almak, tokenize ve dizin tüm içeriği kendim ve bu şekilde aranabilir yapmak zorunda sona erecek. Bu önemli bir çaba gerektirir beri, herkes aynı sorunla karşılaştı ve makul bir çözüm ya da bir çözüm bulduğunu bilmek istiyorum.


Güncelleme 1

Google Apps API konuda bir kusur tracker kaldırdım ama bu sorun için zarif bir çözüm bulmam gerekiyor: https://code.google.com/a/google.com/p/apps-api-issues/issues/detail?id=3780

Güncelleme 2

Bazı ileri geri gittikten sonra, Google'ın mühendisleri bu sorunu gerçekten anlatıldığı gibi var, ve o kabul etti< . em ^"ülke içinde konu açtı". Kusur bileti sıkışmış oldudoktordevlet o zamandan beri. Eğer siz de, benim gibi, bu sorun çözüldü görmeye ilgilenen varsa, lütfen yıldız/için bir dakikanızı ayırın Google's issue tracker üzerinde oy.

CEVAP
2 ŞUBAT 2013, CUMARTESİ


Bir kaç kullanan ( benden daha fazla ses var sanmıştım, belki bu senin tarifine göre çeşitli davalar nedeni) ile benzer ile karşı karşıya kaldım

Benim durumumda Apple önceki içerikler içinde 20 GB boş alan haber vermeden kaldırmış gibiydi. Fark ettim ki 2 kullanan güç veri kullanımı kullananlar, kayıp yeni veri uygulamam (olan anlaşma ile tarihsel hisse senedi fiyatı ) ve diğerleri biz sadece iyi indirme aynı veri boyutu.

O 2, bunları içerikler daha fazla boşluğa izin temiz ve voila, verileri yeniden iyi çalıştı indirdikten sonra yardımcı ile takip ettim.

Bunu Paylaş:
  • Google+
  • E-Posta
Etiketler:

YORUMLAR

SPONSOR VİDEO

Rastgele Yazarlar

  • Howard Pinsky

    Howard Pinsk

    6 AĞUSTOS 2006
  • Jonnyriddlin1

    Jonnyriddlin

    4 Ocak 2007
  • KIT KAT

    KIT KAT

    3 EKİM 2005