8 puan yazan xguru 2020-07-20 | 1 yorum | WhatsApp'ta paylaş

Apache Spark'ta indeks tabanlı sorgu hızlandırmasını mümkün kılan bir alt sistem

→ CSV, JSON, Parquet verileri için indeks oluşturur ve yönetir

→ Bu indeksleri otomatik olarak kullanarak, kodda değişiklik yapmadan sorguları/iş yüklerini hızlandırır

  • TPC benchmark'larında tekil sorgularda sorgu hızında 11 kata kadar artış

→ genel olarak ise standart donanım kullanıldığında yaklaşık 2 kat sorgu performansı artışı

  • create, refresh, delete, restore, vacuum, cancel gibi basit API'ler

  • Scala, Python, .NET desteği

Microsoft Azure bulutundaki Azure Synapse Analytics'te kullanılıyor

( kurumsal veri ambarı ve büyük veri analizini birleştiren sınırsız analiz hizmeti )

1 yorum

 
xguru 2020-07-20

Tanıtım yazısı: Apache Spark™ için bir indeksleme alt sistemi olan Hyperspace artık açık kaynak

https://cloudblogs.microsoft.com/opensource/2020/…