You are not logged in | Log in

ByteStore: Hybrid Layouts for Main-Memory Column Stores

Speaker(s)
Piotr Ulanowski
Affiliation
MIMUW
Date
Jan. 11, 2024, 12:15 p.m.
Room
room 4060
Seminar
Seminarium "DeSeR: Dane, strumienie, rozpraszanie"

Bazy Kolumnowe są obecnie używane do przeprowadzania analiz na dużych danych relacyjnych. Takie analizy zazwyczaj składają się z read-only zapytań. Po wykonaniu tych zapytań, dane są następnie przekazywane do dalszej analizy takiej jak agregacja czy sortowanie. Obecnie stosowane rozwiązania do przechowywania danych w bazach kolumnowych stosują ten sam sposób trzymania kolumn w pamięci na wszystkich kolumnach. Może to prowadzić do mniej wydajnych zapytań, z powodu różnych możliwych skew w kolumnach na których te rozwiązania się opierają. ByteStore łączy te rozwiązania i dobiera te optymalne dla każdej z kolumn. Na początku powiem o zapytaniach na bazach kolumnowych. Następnie pokażę powszechnie stosowane rozwiązania do przechowywania danych w kolumnach i zapytania na nich. Wreszcie pokażę metody, z których korzysta ByteStore i w jaki sposób dobiera odpowiednie rozwiązania dla kolumn. Ostatecznie pokażę benchmarki jakie zostały przeprowadzone przez autorów oraz wnioski z nich płynących.