Nie jesteś zalogowany | zaloguj się

Wydział Matematyki, Informatyki i Mechaniki Uniwersytetu Warszawskiego

  • Skala szarości
  • Wysoki kontrast
  • Negatyw
  • Podkreślenie linków
  • Reset

Aktualności — Wydarzenia

Seminarium "DeSeR: Dane, strumienie, rozpraszanie"

 

ByteStore: Hybrid Layouts for Main-Memory Column Stores


Prelegent: Piotr Ulanowski

2024-01-11 12:15

Bazy Kolumnowe są obecnie używane do przeprowadzania analiz na dużych danych relacyjnych. Takie analizy zazwyczaj składają się z read-only zapytań. Po wykonaniu tych zapytań, dane są następnie przekazywane do dalszej analizy takiej jak agregacja czy sortowanie. Obecnie stosowane rozwiązania do przechowywania danych w bazach kolumnowych stosują ten sam sposób trzymania kolumn w pamięci na wszystkich kolumnach. Może to prowadzić do mniej wydajnych zapytań, z powodu różnych możliwych skew w kolumnach na których te rozwiązania się opierają. ByteStore łączy te rozwiązania i dobiera te optymalne dla każdej z kolumn. Na początku powiem o zapytaniach na bazach kolumnowych. Następnie pokażę powszechnie stosowane rozwiązania do przechowywania danych w kolumnach i zapytania na nich. Wreszcie pokażę metody, z których korzysta ByteStore i w jaki sposób dobiera odpowiednie rozwiązania dla kolumn. Ostatecznie pokażę benchmarki jakie zostały przeprowadzone przez autorów oraz wnioski z nich płynących.