The seminar is devoted to the theory and practice of data management and knowledge representation. We are interested in challenges related to the processing of data, queries, and metadata (schemas, constraints, dependencies, ontologies), ranging from designing and analyzing abstract formalisms all the way to database systems architecture and distributed processing of big data. We like our data in all flavors: not only relational, but also semistructured (XML, JSON), graph (RDF, LPG), object, text, temporal, stream, GIS, and others.
The problems tackled can be theoretical, requiring tools from algorithmics, combinatorics, logic (e.g. finite model theory), and automata theory, as well as very practical, in the spirit of systems and software engineering. MSc theses written within our seminar may study decidability and complexity of abstract problems, design algorithms and heuristics, implement and experiment with existing theoretical solutions, or analyze, compare and extend existing systems.
We meet and discuss with experts in other disciplines, who sometimes supply ideas for MSc theses. We have cooperated or are currently cooperating with astronomers, chemists, and geographers. We are also open for other areas where databases can be applied.
Seminar presentations are usually based on recent papers presented at leading international conferences devoted to data management and knowledge representation, such as VLDB, PODS, SIGMOD, or KR.
Selected topics:
* Data models, semantics, query languages
* Data provenance
* Databases for emerging hardware
* Distributed and parallel databases
* Graph data management, RDF, social networks, Semantic Web
* Knowledge discovery, clustering, data mining
* Machine learning for data management and vice versa
* Model theory, logics, algebras, computational complexity
* Ontology-based data access, data integration and exchange, metadata management
* Ontology formalisms and models, description logics
* Privacy, security, ethics
* Query processing and optimization
* Scientific databases
* Semi-structured data
* Small data, end-user programming
* Storage, indexing, and physical database design
* Streams, sensor networks, complex event processing
* Transaction processing
* Uncertainty, incompleteness, and inconsistency in data management
- dr hab. Filip Murlak, prof. ucz.
- dr Jacek Sroka
- prof. dr hab. Krzysztof Stencel
- prof. dr hab. Jerzy Tyszkiewicz
Tuesdays, 10:15 a.m. , room: 4060
List of talks
Jan. 21, 2025, 10:15 a.m.
Damian Werpachowski (MIMUW)
Implementation of UDP network stack for Java using ef_vi (Implementation of UDP network stack for Java using ef_vi)
Jan. 14, 2025, 10:15 a.m.
Michał Molas (MIMUW)
LadderFilter: Filtrowanie rzadkich elementów przy niewielkim zużyciu pamięci i czasu (LadderFilter: Filtering Infrequent Items with Small Memory and Time Overhead)
Jan. 7, 2025, 10:15 a.m.
Katarzyna Mielnik (MIMUW)
Lemo: A Cache-Enhanced Learned Optimizer for Concurrent Queries (Lemo: A Cache-Enhanced Learned Optimizer for Concurrent Queries)
Realizacja wielu zapytań w krótkim czasie ma szerokie zastosowanie praktyczne. Aby jednak osiągnąć wysoką wydajność, kluczowe jest zminimalizowanie powtarzających się obliczeń oraz opracowanie efektywnego planu wykonania współbieżnych zapytań. W metodzie Lemo zastosowano wytrenowaną sieć, która …
Dec. 17, 2024, 10:15 a.m.
Zuzanna Surowiec (MIMUW)
Low-Latency Adaptive Distributed Stream Join System Based on a Flexible Join Model
W moim referacie przybliżę systemy przetwarzania strumieniowego oraz przedstawię problem łączeń strumieniowych na dowolnych predykatach. Omówię istniejące modele łączenia strumieniowego na przykładzie MatrixModel oraz BicliqueModel, rozważając ich wady i zalety. Podczas referatu, skupię się na …
Dec. 10, 2024, 10:15 a.m.
Agata Bielenica (MIMUW)
Obliczanie wartości Shapleya faktów w odpowiadaniu na zapytania (Computing the Shapley Value of Facts in Query Answering)
W referacie podejmę problem wyjaśniania, dlaczego dane zapytanie bazy danych daje określony wynik. Posłuży do tego teorio-growe pojęcie wartości Shapleya. Intuicyjnie, wartość Shapleya dla pewnego faktu z bazy danych, zapytania i krotki reprezentuje, jak bardzo …
Dec. 3, 2024, 10:15 a.m.
Jakub Kłos (MIMUW)
Szybkie ciągłe dopasowywanie podgrafów w strumieniowych grafach za pomocą redukcji cofania
Nov. 26, 2024, 10:15 a.m.
Michał Garbacz (MIMUW)
Continual release of differentially private synthetic data (Continual release of differentially private synthetic data)
Nov. 5, 2024, 10:15 a.m.
Marcin Mordecki (MIMUW)
Wstęp do analizy wpływu wykorzystania instrukcji SIMD na wydajność przetwarzania danych
Oct. 29, 2024, 10:15 a.m.
Łukasz Orawiec (MIMUW)
A JSONPath query compiler targeting JSON parsers APIs
Oct. 22, 2024, 10:15 a.m.
Piotr Ulanowski (MIMUW)
PathFinder: Algorytmy ewaluacji zapytań w bazach grafowych
Oct. 15, 2024, 11 a.m.
Krzysztof Stencel (MIMUW)
Jak przestałem się martwić i pokochałem ChatGPT (How I Learned to Stop Worrying and Love ChatGPT)
In the dynamic landscape of software engineering, the emergence of ChatGPT-generated code signifies a distinctive and evolving paradigm in development practices. We delve into the impact of interactions with ChatGPT on the software development process, …
Oct. 15, 2024, 10:15 a.m.
Michał Jadwiszczak (MIMUW)
Rozproszone agregaty w rozproszonej szerokokolumnowej bazie danych (Distributed aggregation in a distributed wide-column database)
Distributed databases in comparison to single-server databases open a wide area of new possibilities. While there is a potential of increasing the throughput, reducing the execution time and making more efficient use of machines, there …
June 6, 2024, 12:15 p.m.
Grzegorz Bogusław Zaleski (MIMUW)
A comparison of software measures with a subjective assessment of quality (Porównanie miar oprogramowania z subiektywną oceną jakości)
May 23, 2024, 12:15 p.m.
Jacek Ciszewski (MIMUW)
PG schema validation
Recent years have seen property graph databases popularity and demand rising. With great focus in the field put on graph query languages, a variety of existing graph schemas differs substantially in supported features, with upcoming …