Tematyka seminarium obejmuje teorię i praktykę przetwarzania danych i reprezentacji wiedzy. Interesują nas wyzwania związane z przetwarzaniem danych, zapytań i metadanych (schematów, więzów, zależności, ontologii) - od projektowania i analizy abstrakcyjnych formalizmów aż po architekturę systemów i rozpraszanie obliczeń na dużych danych. Rozważamy różne rodzaje danych: nie tylko dane relacyjne, ale również semistrukturalne (XML, JSON), grafowe (RDF, LPG), obiektowe, tekstowe, temporalne, strumieniowe, aż po systemy informacji geograficznej (GIS).
Podejmujemy zarówno zagadnienia teoretyczne, wykorzystujące warsztat algorytmiki, kombinatoryki, logiki (np. teorii modeli skończonych) i teorii automatów, jak i praktyczne, opierające się na narzędziach inżynierii oprogramowania i wiedzy o systemach. Prace magisterskie powstające w ramach seminarium mogą badać rozstrzygalność i złożoność abstrakcyjnych problemów decyzyjnych, projektować algorytmy i heurystyki, implementować i testować istniejące rozwiązania teoretyczne, czy też analizować, porównywać i rozszerzać istniejące systemy.
Spotykamy się również i dyskutujemy z badaczami z innych dziedzin, którzy czasami dostarczają nam pomysłów na tematy prac magisterskich. Współpracowaliśmy już lub nadal współpracujemy z astronomami, chemikami, geografami. Jesteśmy nadal otwarci na inne obszary zastosowań.
Referaty seminaryjne są zwykle wygłaszane na podstawie wybranych prac z głównych międzynarodowych konferencji poświęconych bazom danych i reprezentacji wiedzy, takich jak VLDB, PODS, SIGMOD i KR.
Przykładowe zagadnienia:
* Data models, semantics, query languages
* Data provenance
* Databases for emerging hardware
* Distributed and parallel databases
* Graph data management, RDF, social networks, Semantic Web
* Knowledge discovery, clustering, data mining
* Machine learning for data management and vice versa
* Model theory, logics, algebras, computational complexity
* Ontology-based data access, data integration and exchange, metadata management
* Ontology formalisms and models, description logics
* Privacy, security, ethics
* Query processing and optimization
* Scientific databases
* Semi-structured data
* Small data, end-user programming
* Storage, indexing, and physical database design
* Streams, sensor networks, complex event processing
* Transaction processing
* Uncertainty, incompleteness, and inconsistency in data management
Organizatorzy
- dr hab. Filip Murlak, prof. ucz.
- dr hab. Jacek Sroka
- prof. dr hab. Krzysztof Stencel
- prof. dr hab. Jerzy Tyszkiewicz
Informacje
wtorki, 10:15 , sala: 4060Strona domowa
https://sites.google.com/view/sembdmimuw?pli=1&authuser=1Dziedziny badań
Lista referatów
-
9 grudnia 2025 11:00
Piotr Baranowski (MIMUW)
Meces: Latency-efficient Rescaling via Prioritized State Migration for Stateful Distributed Stream Processing Systems (Meces: Latency-efficient Rescaling via Prioritized State Migration for Stateful Distributed Stream Processing Systems)
Podczas seminarium przedstawię pracę „Meces: Latency-efficient Rescaling via Prioritized State Migration for Stateful Distributed Stream Processing Systems”, zaprezentowaną na konferencji USENIX ATC ’22. Najpierw przybliżę podstawy przetwarzania strumieniowego z utrzymywanym stanem, a następnie skupię się …
-
9 grudnia 2025 10:15
Michał Sobczak (MIMUW)
Corra: Correlation-Aware Column Compression (Corra: Correlation-Aware Column Compression)
Podczas referatu przedstawię podstawowe techniki wykorzystywane w kompresji lekkiej w systemach baz danych, uzupełnione krótką charakterystyką ich zalet i ograniczeń. Choć w praktyce dominuje kompresja kolumnowa, podejście to wiąże się z istotną wadą: prowadzi do …
-
2 grudnia 2025 10:15
Karol Wąsowski (MIMUW)
Photon: A Fast Query Engine for Lakehouse Systems (Photon: A Fast Query Engine for Lakehouse Systems)
Podczas referatu przedstawię kluczowe założenia i wyniki pracy "Photon: A Fast Query Engine for Lakehouse Systems" zaprezentowanej na konferencji SIGMOD 2022, w której autorzy propnują nowy silnik do efektywnej pracy z danymi przechowanymi w Datalake'ach. …
-
25 listopada 2025 11:00
Piotr Głowacki (MIMUW)
Boosting File Systems Elegantly: A Transparent NVM Write-ahead Log for Disk File Systems (Boosting File Systems Elegantly: A Transparent NVM Write-ahead Log for Disk File Systems)
Podczas referatu przedstawię kluczowe założenia i wyniki pracy „Boosting File Systems Elegantly: A Transparent NVM Write-ahead Log for Disk File Systems” (Wang et al., FAST 2025), w której zaproponowano system NVLog. Zacznę od wyjaśnienia czym …
-
25 listopada 2025 10:15
Dawid Pawlik (MIMUW)
Highways, Neighbors, Shortcuts, Walks - Introduction to ANN search and HNSW algorithm (Highways, Neighbors, Shortcuts, Walks - Introduction to ANN search and HNSW algorithm)
Podczas seminarium przedstawię algorytm HNSW, będący wynikiem pracy "Efficient and robust approximate nearest neighbor search using Hierarchical Navigable Small World graphs" (Yu. A. Malkov, D. A. Yashunin, IEEE Transactions on Pattern Analysis and Machine Intelligence), …
-
18 listopada 2025 10:15
Justyna Palikowska (MIMUW)
To Partition, or Not to Partition — optymalizacja złączeń w systemach baz danych
Podczas referatu przedstawię kluczowe wyniki pracy “To Partition, or Not to Partition, That Is the Join Question in a Real System” (Bandle, Giceva, Neumann, SIGMOD 2021), w której porównano Radix Join (partycjonowany hash join) z …
-
14 listopada 2025 10:15
Gustaw Blachowski (MIMUW)
The Key to Effective UDF Optimization: Before Inlining, First Perform Outlining (The Key to Effective UDF Optimization: Before Inlining, First Perform Outlining)
Podczas seminarium przedstawię kluczowe założenia i wyniki publikacji "PRISM: Efficiently Executing User-Defined Functions with UDF Outlining". Referat skupi się na nowej metodzie optymalizacji wykonania funkcji definiowanych przez użytkownika (UDF) w systemach zarządzania bazami danych (SZBD), …
-
4 listopada 2025 10:15
Zuzanna Ossowska (MIMUW)
When the Operating System Becomes a Database: A Look Inside OSDB (When the Operating System Becomes a Database: A Look Inside OSDB)
Podczas seminarium przedstawię założenia, implementację oraz wyniki pracy „OSDB: Exposing the Operating System’s Inner Database”. Omówię koncepcję traktowania danych systemu operacyjnego (takich jak informacje o procesach czy otwartych gniazdach sieciowych) jako relacyjnej bazy danych, co …
-
21 października 2025 11:00
Michał Molas (MIMUW)
Metody predykcji popytu na zlecenia transportowe
Referat będzie wprowadzeniem do mojej pracy magisterskiej pt. "Machine learning approaches to transportation order demand prediction", dotyczącej predykcji popytu na zlecenia transportowe. Skupię się na zareprezentowniu podstawowych metod prognozowania szeregów czasowych. Opowiem, zarówno o klasycznych …
-
21 października 2025 10:15
Zuzanna Surowiec (MIMUW)
Optymalizacja zapytań złączeniowych z użyciem wyżarzania przestrzeni konformacyjnej
Podczas referatu przedstawię problem optymalizacji kolejności złączeń w zapytaniach bazodanowych, jak i istniejące dla niego rozwiązania. Przedstawię metodę wyżarzania przestrzeni konformacyjnej (Conformational Space Annealing), jak i planowane jej użycie w problemie optymalizacji kolejności złączeń.
-
14 października 2025 11:00
Krzysztof Żyndul (MIMUW)
Games that pay (Games that pay)
Referat będzie poświęcony mojej pracy magisterskiej pt. „Algorithmic Problems for Games on Weighted Graphs”. Praca dotyczy gier rozgrywanych na grafach z wagami, które stanowią ważny model w teorii gier i weryfikacji systemów. W szczególności zajmuję …
-
14 października 2025 10:15
Jakub Kłos (MIMUW)
Kompilacja wiedzy w walidacji względem PG-Schema
Grafy własnościowe są szeroko stosowane w dziedzinach, w których dane w naturalny sposób przyjmują strukturę grafu, takich jak sieci społecznościowe, finanse czy cyberbezpieczeństwo. Możliwość zapewnienia, że graf własnościowy jest zgodny ze specyfikacją schematu, ma kluczowe …
-
10 czerwca 2025 11:00
Agata Bielenica (MIMUW)
JEDI: These aren't the JSON documents you're (JEDI: These aren't the JSON documents you're)
W moim referacie przedstawiam pracę "JEDI: These aren't the JSON documents you're looking for..." (Hütter, Augsten, Kirsch, Carey, Li). Publikacja dotyczy problemu wyszukiwania podobnych dokumentów JSON w bazie danych — celem jest odnalezienie wszystkich dokumentów …
-
10 czerwca 2025 10:15
Krzysztof Żyndul (MIMUW)
Information Theory Strikes Back: New Development in the Theory of Cardinality Estimation (Information Theory Strikes Back: New Development in the Theory of Cardinality Estimation)
W moim referacie przedstawię estymator LpBound, zaprezentowany w pracy "LpBound: Pessimistic Cardinality Estimation using lp-Norms of Degree Sequences". Estymator ten wyznacza dowodliwie ścisłe, górne ograniczenie na rozmiar wyników zapytań. Wykorzystuje do tego lp-normy ciągów stopni …
-
3 czerwca 2025 10:15
Łukasz Orawiec (MIMUW)
A JSONPath query compiler targeting JSON parsers APIs (A JSONPath query compiler targeting JSON parsers APIs)
Istnieje wiele implementacji parserów danych w formacie JSON, oferujących różne rodzaje API. Z drugiej strony, odczytywanie danych z dokumentów JSON może być wyrażane za pomocą JSONPath, standaryzowanego języka zapytań, będącego odpowiednikiem popularnego XPath dla dokumentów …
Nie jesteś zalogowany |