Supporting Descendants in SIMD-Accelerated JSONPath
- Prelegent(ci)
- Maciej Herdon
- Afiliacja
- MIMUW
- Język referatu
- polski
- Termin
- 12 listopada 2024 10:15
- Pokój
- p. 4060
- Seminarium
- Seminarium "DeSeR: Dane, strumienie, rozpraszanie"
JSON to format wybierany zarówno do współczesnej komunikacji sieciowej jak i do zbiorów danych. Wciąż jednak szybkie przetwarzanie dokumentów w formacie JSON jest istotnym wyzwanie. Jak niedawno zaprezentowali Langdale i Lemire ("Parsing Gigabytes of JSON per Second", The VLDB Journal, 28(6), 2019), istotne przyspieszenie może zostać osiągnięte z wykorzystaniem instrukcji SIMD (Single Instruction, Multiple Data; jedna instrukcja, wiele danych) obecnych w obecnych generacjach procesorów. W tej pracy przechodzimy od parsowania do wykonywania zapytań na JSON-ach. Skupiamy się na języku zapytań JSONPath, podobnym do XPath. Naszym celem jest ewaluacja zapytań JSONPath w modelu strumieniowym, bez konstruowania i utrzymywania kosztownej reprezentacji drzewiastej. Pomimo tego, że strumieniowe przetwarzanie zapytań JSONPath w ogólności wymaga stosu, wiele zapytań może zostać wykonanych korzystając ze strategii bezstosowych (Barloy, Murlak, Paperman, "Stackless Processing of Streamed Trees", PODS 2021). W tej pracy rozpatrujemy możliwe przyspieszenia wynikające z przetwarzania SIMD i strategii wykonania bez rozgałęzień.