You are not logged in | Log in

Supporting Descendants in SIMD-Accelerated JSONPath

Speaker(s)
Maciej Herdon
Affiliation
MIMUW
Language of the talk
Polish
Date
Nov. 12, 2024, 10:15 a.m.
Room
room 4060
Seminar
Seminarium "DeSeR: Dane, strumienie, rozpraszanie"

JSON to format wybierany zarówno do współczesnej komunikacji sieciowej jak i do zbiorów danych. Wciąż jednak szybkie przetwarzanie dokumentów w formacie JSON jest istotnym wyzwanie. Jak niedawno zaprezentowali Langdale i Lemire ("Parsing Gigabytes of JSON per Second", The VLDB Journal, 28(6), 2019), istotne przyspieszenie może zostać osiągnięte z wykorzystaniem instrukcji SIMD (Single Instruction, Multiple Data; jedna instrukcja, wiele danych) obecnych w obecnych generacjach procesorów. W tej pracy przechodzimy od parsowania do wykonywania zapytań na JSON-ach. Skupiamy się na języku zapytań JSONPath, podobnym do XPath. Naszym celem jest ewaluacja zapytań JSONPath w modelu strumieniowym, bez konstruowania i utrzymywania kosztownej reprezentacji drzewiastej. Pomimo tego, że strumieniowe przetwarzanie zapytań JSONPath w ogólności wymaga stosu, wiele zapytań może zostać wykonanych korzystając ze strategii bezstosowych (Barloy, Murlak, Paperman, "Stackless Processing of Streamed Trees", PODS 2021). W tej pracy rozpatrujemy możliwe przyspieszenia wynikające z przetwarzania SIMD i strategii wykonania bez rozgałęzień.