ByteStore: Hybrid Layouts for Main-Memory Column Stores
- Speaker(s)
- Piotr Ulanowski
- Affiliation
- MIMUW
- Date
- Jan. 11, 2024, 12:15 p.m.
- Room
- room 4060
- Seminar
- Seminarium "DeSeR: Dane, strumienie, rozpraszanie"
Bazy Kolumnowe są obecnie używane do przeprowadzania analiz na dużych danych relacyjnych. Takie analizy zazwyczaj składają się z read-only zapytań. Po wykonaniu tych zapytań, dane są następnie przekazywane do dalszej analizy takiej jak agregacja czy sortowanie. Obecnie stosowane rozwiązania do przechowywania danych w bazach kolumnowych stosują ten sam sposób trzymania kolumn w pamięci na wszystkich kolumnach. Może to prowadzić do mniej wydajnych zapytań, z powodu różnych możliwych skew w kolumnach na których te rozwiązania się opierają. ByteStore łączy te rozwiązania i dobiera te optymalne dla każdej z kolumn. Na początku powiem o zapytaniach na bazach kolumnowych. Następnie pokażę powszechnie stosowane rozwiązania do przechowywania danych w kolumnach i zapytania na nich. Wreszcie pokażę metody, z których korzysta ByteStore i w jaki sposób dobiera odpowiednie rozwiązania dla kolumn. Ostatecznie pokażę benchmarki jakie zostały przeprowadzone przez autorów oraz wnioski z nich płynących.