Nie jesteś zalogowany | Zaloguj się
Powrót do listy seminarów

Seminarium "DeSeR: Dane, strumienie, rozpraszanie"


Organizatorzy

Informacje

czwartki, 12:15 , sala: 4060

Dziedziny badań

Lista referatów

  • 25 kwietnia 2024 12:15
    Marcin Mordecki (MIMUW)
    Stackless Processing of Streamed Trees - kont.
    Kontynuujemy analizę automatów z rejestrami podczas wykonywania zapytań na strumieniowanych dokumentach. Przyjrzymy się dokładniej działaniu wariantów tych automatów na kilku przykładach, które rozróżniają automat z rejestrami od klasycznego automatu deterministycznego. Na koniec prześledzimy, jak zasymulować …

  • 18 kwietnia 2024 12:15
    Marcin Mordecki (MIMUW)
    Stackless Processing of Streamed Trees
    Opowiem o przetwarzaniu strumieniowanych drzew w ograniczonej pamięci. Na początek wprowadzę model automatu z rejestrami głębokości, a także wspomnę o szczególnym przypadku automatu bezrejestrowego. Scharakteryzuję języki drzew, które są rozpoznawane przez te automaty, oraz rodzaje …

  • 11 kwietnia 2024 12:15
    Maciej Herdon (MIMUW)
    In-Situ Cross-Database Query Processing
    Dzisiejsze organizacje korzystają z mnóstwa heterogenicznych i autonomicznych systemów DBMS, wiele z nich jest rozproszonych w różnych lokalizacjach geograficznych. Dlatego kluczowe jest posiadanie skutecznych i wydajnych zdolności przetwarzania zapytań między różnymi bazami danych. Zaprezentuję XDB, …

  • 4 kwietnia 2024 12:15
    Łukasz Orawiec (MIMUW)
    QueryBooster: Improving SQL Performance Using Middleware Services for Human-Centered Query Rewriting
    Przepisywanie zapytań SQL jest techniką optymalizacji polegającą na przekształcaniu zapytań w zapytania równoważne o większej wydajności. Technika może być pożyteczna w systemach, w których warstwy aplikacji oraz bazy danych muszą być traktowane jako „czarne skrzynki”, …

  • 21 marca 2024 12:15
    Piotr Ulanowski (MIMUW)
    Wektoryzacja do parsowania gigabajtów danych plików JSON w ciągu sekund
    Referat będzie bazował na publikacji: https://arxiv.org/pdf/1902.08318.pdf Na początku wyjaśnię, czym dokładnie jest proces parsowania w przypadku plików JSON, oraz na jakie problemy można napotkać w trakcie tego procesu. Następnie uzasadnię, dlaczego warto w ogóle zajmować …

  • 14 marca 2024 12:15
    Alexandra Rogova (IRIF, Université de Paris, Francja.)
    Property Graph Languages
    The development of practical query languages for graph databases runs well ahead of the underlying theory. The ISO committee in charge of database query languages is currently developing a new standard called Graph Query Language …

  • 29 lutego 2024 12:15
    Jakub Pawlewicz (MIMUW)
    Indeksy wyuczone na danych; najnowsze wyniki
    Mając dany niemalejący ciąg liczb S = {x_1, ..., x_n}, chcemy odpowiadać na pytania, gdzie wpadłby nowy klucz k: |{x \in S | x < k}|. Zakładamy, że S jest ustalone raz, a my chcemy …

  • 25 stycznia 2024 12:15
    Michał J. Gajda (MigaMake Pte Ltd)
    Towards a perfect union type: automatic typing of JSON documents
    We present a principled theoretical framework for inferring and checking the union types, and show its work in practice on JSON data structures. The framework poses a union type inference as a learning problem from …

  • 18 stycznia 2024 12:15
    Kacper Konecki: (MIMUW)
    Immersyjna wizualizacja systemu kontroli wersji
    Referat będzie o przeprowadzonej próbie wizualizacji zmian w repozytoriach kodu przy użyciu środowisk rzeczywistości wirtualnej (VR) oraz rozszerzonej rzeczywistości (AR). Na wstępie przedstawię prototyp stworzonego narzędzia, które umożliwia wizualizację historii modyfikacji w repozytoriach Git. Następnie …

  • 11 stycznia 2024 12:15
    Piotr Ulanowski (MIMUW)
    ByteStore: Hybrid Layouts for Main-Memory Column Stores
    Bazy Kolumnowe są obecnie używane do przeprowadzania analiz na dużych danych relacyjnych. Takie analizy zazwyczaj składają się z read-only zapytań. Po wykonaniu tych zapytań, dane są następnie przekazywane do dalszej analizy takiej jak agregacja czy …

  • 21 grudnia 2023 12:15
    Łukasz Orawiec (MIMUW)
    InfiniStore: Elastic Serverless Cloud Storage
    Model Function-as-a-Service pozwala tworzyć systemy, będące zbiorami funkcji umożliwiających wykonywanie kodu bez konieczności zarządzania infrastrukturą. Natychmiastowe i automatyczne skalowanie funkcji, zapewniane przez usługodawcę, szybki dostęp do danych przechowywanych w instancjach funkcji oraz korzystne naliczanie opłat …

  • 14 grudnia 2023 12:15
    Maciej Herdon (MIMUW)
    EvenDB: Optimizing Key-Value Storage for Spatial Locality
    Zastosowania wykorzystujące pamięć klucz-wartość(KV) często manifestują dużą lokalność danych, przykładowo kiedy wiele elementów posiada identyczne prefixy kluczy. Ten powszechny wzorzec dostępu jest niewystarczająco wykorzystywany przez wszechobecną strukturę Log-structured merge-tree znajdującą się u podstaw wysokoprzepustowych magazynów KV w obecnych czasach. Zespół …

  • 7 grudnia 2023 12:15
    Michał Jadwiszczak (MIMUW)
    Rozproszone agregacje w ScyllaDB
    Podczas referatu zaprezentuję aktualne postępy mojej pracy magisterskiej. Przedstawię zastosowaną metodę rozpraszania obliczeń w bazie, oraz wyniki pierwszych benchmarków. Opowiem o ograniczeniach aktualnej implementacji i jak planuję je rozwiązać. Na koniec przedstawię moje wnioski jakie …

  • 30 listopada 2023 12:15
    Zofia Salata (MIMUW)
    Vector Database Management Systems Overview
    In my presentation I'd like to offer a high level overview of Vector Databases, which become more and more popular with the growth of large language models and recommendation platforms. They are used to retrieve …

  • 23 listopada 2023 12:15
    Marcin Mordecki (MIMUW)
    Marcin Mordecki: Monarch - Google’s planet-scale timeseries database
    Google posiada wiele produktów, z których znaczna część działa w skali globalnej. Używając ich na co dzień, często przyjmujemy za oczywiste ich płynne działanie - względna wydajność, rzadkie awarie, itp. Zespoły rozwijające i utrzymujące te …