SORU
19 EKİM 2010, Salı


Hangi paralel sıralama algoritması en iyi ortalama durum performansı?

Sıralama alır O(n log n) seri halinde. Eğer(n) işlemci var eğer doğrusal bir hızlanma için umut ediyoruz. (Günlük n) paralel algoritma var ama çok yüksek bir sabit var. Onlar da yakın yerde O(n) işlemciler yok olan emtia donanım üzerinde geçerli değil. P işlemciler, makul algoritmaları(n/p log n) zaman alır.

Seri halinde, hızlı sıralama, ortalama en iyi çalışma zamanı karmaşıklığı vardır. Paralel hızlı bir sıralama algoritması uygulamak kolay (here here). Ancak ilk adım, tek bir çekirdek bütün toplama bölümü olduğu için iyi bir performans değil. Paralel sıralama algoritmaları birçok bilgi buldum ama şu ana kadar hiçbir şey kesin bir kazanan işaret görmedim.

JVM dil 8 32 çekirdeği üzerinde çalışan 1 milyon 100 milyon unsurların listeleri sıralamak için arıyorum.

CEVAP
19 EKİM 2010, Salı


Aşağıdaki article (PDF indir) paralel çeşitli mimarileri: sıralama algoritmaları, karşılaştırmalı bir çalışma

Parallel sorting algorithms on various architectures

Makaleye göreörnek türbirçok paralel mimarlık türleri. en iyi gibi görünüyor

Update yaş Mark endişelerini gidermek için:

Burada daha yeni makaleler bir şey daha Roman (btw, hala örnek sıralama ile karşılaştırıldığında, hangi 2007) tanıtımı:

Improvements on sample sortAA-Sort

Kanama kenar (2010, sadece bir kaç aylık bazı yaklaşık):

Parallel sorting patternMany-core GPU based parallel sortingHybrid CPU/GPU parallel sortRandomized Parallel Sorting Algorithm with an Experimental StudyHighly scalable parallel sortingSorting N-Elements Using Natural Order: A New Adaptive Sorting Approach

2013 için güncelleme: Burada kanama kenar yaklaşık Ocak, 2013. (Not: bağlantıları Bir kaç Citeseer ve ücretsiz kayıt gerektirir) Bildiriler için:

Üniversite ders:Parallel Partitioning for Selection and SortingParallel Sorting Algorithms LectureParallel Sorting Algorithms Lecture 2Parallel Sorting Algorithms Lecture 3A novel sorting algorithm for many-core architectures based on adaptive bitonic sortHighly Scalable Parallel Sorting 2Parallel MergingParallel Merging 2Parallel Self-Sorting System for ObjectsPerformance Comparison of Sequential Quick Sort and Parallel Quick Sort AlgorithmsShared Memory, Message Passing, and Hybrid Merge Sorts for Standalone and Clustered SMPsVarious parallel algorithms (sorting et al) including implementationsAn OpenCL Method of Parallel Sorting Algorithms for GPU ArchitectureData Sorting Using Graphics Processing UnitsEfficient Algorithms for Sorting on GPUsDesigning efficient sorting algorithms for manycore GPUsDeterministic Sample Sort For GPUsFast in-place sorting with CUDA based on bitonic sortFast parallel GPU-sorting using a hybrid algorithmFast Parallel Sorting Algorithms on GPUsFast sort on CPUs and GPUs: a case for bandwidth oblivious SIMD sortGPU sample sortGPU-ABiSort: Optimal Parallel Sorting on Stream ArchitecturesGPUTeraSort: high performance graphics co-processor sorting for large database managementHigh performance comparison-based sorting algorithm on many-core GPUsParallel external sorting for CUDA-enabled GPUs with load balancing and low transfer overheadSorting on GPUs for large scale datasets: A thorough comparison

Bunu Paylaş:
  • Google+
  • E-Posta
Etiketler:

YORUMLAR

SPONSOR VİDEO

Rastgele Yazarlar

  • Moodle

    Moodle

    11 Mayıs 2010
  • Noam Erez

    Noam Erez

    3 NİSAN 2012
  • Shantanu Sood

    Shantanu Soo

    3 Kasım 2008