Nie jesteś zalogowany | Zaloguj się

ByteStore: Hybrid Layouts for Main-Memory Column Stores

Prelegent(ci)
Piotr Ulanowski
Afiliacja
MIMUW
Termin
11 stycznia 2024 12:15
Pokój
p. 4060
Seminarium
Seminarium "DeSeR: Dane, strumienie, rozpraszanie"

Bazy Kolumnowe są obecnie używane do przeprowadzania analiz na dużych danych relacyjnych. Takie analizy zazwyczaj składają się z read-only zapytań. Po wykonaniu tych zapytań, dane są następnie przekazywane do dalszej analizy takiej jak agregacja czy sortowanie. Obecnie stosowane rozwiązania do przechowywania danych w bazach kolumnowych stosują ten sam sposób trzymania kolumn w pamięci na wszystkich kolumnach. Może to prowadzić do mniej wydajnych zapytań, z powodu różnych możliwych skew w kolumnach na których te rozwiązania się opierają. ByteStore łączy te rozwiązania i dobiera te optymalne dla każdej z kolumn. Na początku powiem o zapytaniach na bazach kolumnowych. Następnie pokażę powszechnie stosowane rozwiązania do przechowywania danych w kolumnach i zapytania na nich. Wreszcie pokażę metody, z których korzysta ByteStore i w jaki sposób dobiera odpowiednie rozwiązania dla kolumn. Ostatecznie pokażę benchmarki jakie zostały przeprowadzone przez autorów oraz wnioski z nich płynących.