Nie jesteś zalogowany | Zaloguj się

Supporting Descendants in SIMD-Accelerated JSONPath

Prelegent(ci)
Maciej Herdon
Afiliacja
MIMUW
Język referatu
polski
Termin
12 listopada 2024 10:15
Pokój
p. 4060
Seminarium
Seminarium "DeSeR: Dane, strumienie, rozpraszanie"

JSON to format wybierany zarówno do współczesnej komunikacji sieciowej jak i do zbiorów danych. Wciąż jednak szybkie przetwarzanie dokumentów w formacie JSON jest istotnym wyzwanie. Jak niedawno zaprezentowali Langdale i Lemire ("Parsing Gigabytes of JSON per Second", The VLDB Journal, 28(6), 2019), istotne przyspieszenie może zostać osiągnięte z wykorzystaniem instrukcji SIMD (Single Instruction, Multiple Data; jedna instrukcja, wiele danych) obecnych w obecnych generacjach procesorów. W tej pracy przechodzimy od parsowania do wykonywania zapytań na JSON-ach. Skupiamy się na języku zapytań JSONPath, podobnym do XPath. Naszym celem jest ewaluacja zapytań JSONPath w modelu strumieniowym, bez konstruowania i utrzymywania kosztownej reprezentacji drzewiastej. Pomimo tego, że strumieniowe przetwarzanie zapytań JSONPath w ogólności wymaga stosu, wiele zapytań może zostać wykonanych korzystając ze strategii bezstosowych (Barloy, Murlak, Paperman, "Stackless Processing of Streamed Trees", PODS 2021). W tej pracy rozpatrujemy możliwe przyspieszenia wynikające z przetwarzania SIMD i strategii wykonania bez rozgałęzień.