ByteStore: Hybrid Layouts for Main-Memory Column Stores
- Prelegent(ci)
- Piotr Ulanowski
- Afiliacja
- MIMUW
- Termin
- 11 stycznia 2024 12:15
- Pokój
- p. 4060
- Seminarium
- Seminarium "DeSeR: Dane, strumienie, rozpraszanie"
Bazy Kolumnowe są obecnie używane do przeprowadzania analiz na dużych danych relacyjnych. Takie analizy zazwyczaj składają się z read-only zapytań. Po wykonaniu tych zapytań, dane są następnie przekazywane do dalszej analizy takiej jak agregacja czy sortowanie. Obecnie stosowane rozwiązania do przechowywania danych w bazach kolumnowych stosują ten sam sposób trzymania kolumn w pamięci na wszystkich kolumnach. Może to prowadzić do mniej wydajnych zapytań, z powodu różnych możliwych skew w kolumnach na których te rozwiązania się opierają. ByteStore łączy te rozwiązania i dobiera te optymalne dla każdej z kolumn. Na początku powiem o zapytaniach na bazach kolumnowych. Następnie pokażę powszechnie stosowane rozwiązania do przechowywania danych w kolumnach i zapytania na nich. Wreszcie pokażę metody, z których korzysta ByteStore i w jaki sposób dobiera odpowiednie rozwiązania dla kolumn. Ostatecznie pokażę benchmarki jakie zostały przeprowadzone przez autorów oraz wnioski z nich płynących.