Nie jesteś zalogowany | Zaloguj się

Tematyka seminarium obejmuje teorię i praktykę przetwarzania danych i reprezentacji wiedzy. Interesują nas wyzwania związane z przetwarzaniem danych, zapytań i metadanych (schematów, więzów, zależności, ontologii) - od projektowania i analizy abstrakcyjnych formalizmów aż po architekturę systemów i rozpraszanie obliczeń na dużych danych. Rozważamy różne rodzaje danych: nie tylko dane relacyjne, ale również semistrukturalne (XML, JSON), grafowe (RDF, LPG), obiektowe, tekstowe, temporalne, strumieniowe, aż po systemy informacji geograficznej (GIS).

Podejmujemy zarówno zagadnienia teoretyczne, wykorzystujące warsztat algorytmiki, kombinatoryki, logiki (np. teorii modeli skończonych) i teorii automatów, jak i praktyczne, opierające się na narzędziach inżynierii oprogramowania i wiedzy o systemach. Prace magisterskie powstające w ramach seminarium mogą badać rozstrzygalność i złożoność abstrakcyjnych problemów decyzyjnych, projektować algorytmy i heurystyki, implementować i testować istniejące rozwiązania teoretyczne, czy też analizować, porównywać i rozszerzać istniejące systemy.

Spotykamy się również i dyskutujemy z badaczami z innych dziedzin, którzy czasami dostarczają nam pomysłów na tematy prac magisterskich. Współpracowaliśmy już lub nadal współpracujemy z astronomami, chemikami, geografami. Jesteśmy nadal otwarci na inne obszary zastosowań.

Referaty seminaryjne są zwykle wygłaszane na podstawie wybranych prac z głównych międzynarodowych konferencji poświęconych bazom danych i reprezentacji wiedzy, takich jak VLDB, PODS, SIGMOD i KR.

Przykładowe zagadnienia:

Data models, semantics, query languages
Data provenance
Databases for emerging hardware
Distributed and parallel databases
Graph data management, RDF, social networks, Semantic Web
Knowledge discovery, clustering, data mining
Machine learning for data management and vice versa
Model theory, logics, algebras, computational complexity
Ontology-based data access, data integration and exchange, metadata management
Ontology formalisms and models, description logics
Privacy, security, ethics
Query processing and optimization
Scientific databases
Semi-structured data
Small data, end-user programming
Storage, indexing, and physical database design
Streams, sensor networks, complex event processing
Transaction processing
Uncertainty, incompleteness, and inconsistency in data management

Organizatorzy

dr hab. Filip Murlak, prof. ucz.
dr hab. Jacek Sroka
prof. dr hab. Krzysztof Stencel
prof. dr hab. Jerzy Tyszkiewicz

Informacje

wtorki, 10:15 , sala: 4060

Strona domowa

https://sites.google.com/view/sembdmimuw?pli=1&authuser=1

Dziedziny badań

Lista referatów

14 kwietnia 2026 10:15
Krzysztof Żyndul (MIMUW)
Finding Subgame Perfect Extreme Equilibria (Finding Subgame Perfect Extreme Equilibria)
24 marca 2026 10:15
Zuzanna Surowiec (MIMUW)
CAO: Optymalizacja zapytań złączeniowych z użyciem wyżarzania przestrzeni konformacyjnej
W moim referacie przypomnę problem optymalizacji kolejności złączeń oraz stosowane do niego podejścia. Omówię szerzej metodę wyżarzania przestrzeni konformacyjnej. Przedstawię jej warianty oraz porównam ich wady i zalety. Pokażę postępy w pisaniu rozszerzenia CAO dla …
17 marca 2026 10:15
Michał Molas (MIMUW)
Przegląd współczesnych metod prognozowania szeregów czasowych
Referat będzie stanowił analizę współczesnych metod prognozowania szeregów czasowych, przygotowaną na potrzeby mojej pracy magisterskiej pt. "Machine learning approaches to transportation order demand prediction", dotyczącej prognozowania popytu na zlecenia transportowe. Przedstawię ewolucję podejść badawczych: od …
10 marca 2026 10:15
Jakub Kłos (MIMUW)
Kompilacja wiedzy w walidacji względem PG-Schema
Grafy własnościowe są szeroko stosowane w dziedzinach, w których dane w naturalny sposób przyjmują strukturę grafu, takich jak sieci społecznościowe, finanse czy cyberbezpieczeństwo. Możliwość zapewnienia, że graf własnościowy jest zgodny ze specyfikacją schematu, ma kluczowe …
24 lutego 2026 10:15
Mateusz Gienieczko (Technische Universität München)
Przyszłość, bazy danych i Ty
Sprzęt rozwija się w trudnym do nadążenia tempie. Nowe architektury, koprocesory, ciągle zmieniająca się prędkość złączy, przez które przepływają nasze dane. Powoduje to eksplozję rozwiązań w świecie baz danych, gdzie każda zmiana w specyfikacji sprzętu …
20 stycznia 2026 11:00
Rem Karablin (MIMUW)
Ocena wydajności frameworków Hadoop, Spark i Flink w środowisku chmury hybrydowej
Problemem jest brak kompleksowej i porównawczej oceny frameworków Hadoop, Spark i Flink w środowisku chmury hybrydowej, w którym kluczowymi wyzwaniami są opóźnienia sieciowe, ograniczona przepustowość WAN oraz koszty wynikające z mechanizmu cloud burstingu; w celu …
20 stycznia 2026 10:15
Ewa Kaluś (MIMUW)
Beyond Shortest Paths: Node Fairness in Route Recommendation (Beyond Shortest Paths: Node Fairness in Route Recommendation)
Podczas seminarium przedstawię pracę "Beyond Shortest Paths: Node Fairness in Route Recommendation" (VLDB 2025) (https://www.vldb.org/pvldb/vol18/p3230-ferrara.pdf}. Autorzy pracy wskazują ważny problem w systemach nawigacyjnych: gdy wszyscy użytkownicy otrzymują tę samą najkrótszą trasę, punkty położone poza nią …
13 stycznia 2026 10:15
Katarzyna Mielnik (MIMUW)
Jodes: Efficient Oblivious Join in the Distributed Setting (Jodes: Efficient Oblivious Join in the Distributed Setting)
Tematem prezentacji jest implementacja algorytmu rozproszonego equi-join, skutecznie chroniącego wzorce dostępu do danych w komunikacji międzywęzłowej. Omówię architekturę rozwiązania oraz zestawienie jego efektywności z istniejącymi metodami. (https://www.vldb.org/pvldb/vol18/p1291-wang.pdf)
16 grudnia 2025 11:00
Wiktor Rutecki (MIMUW)
Are You Sure You Want to Use MMAP in Your Database Management System? (Are You Sure You Want to Use MMAP in Your Database Management System?)
Podczas referatu opowiem o zarządzaniu pamięcią w systemach zarządzania bazami danych (DBMS). Zacznę od przypomnienia podstawowych pojęć i mechanizmów związanych z tą tematyką (pamięć wirtualna i podręczna, pula buforów, TLB). Następnie omówię pracę "Are You …
16 grudnia 2025 10:15
Piotr Styczyński (MIMUW)
BioSeqDB - obsługa dużych danych genomowych w kontekście relacyjnym
W ramach prezentacji przeprowadzę krótki wstęp z podstawowych pojęć związanych z pracą analityczną z danymi pochodzącymi z sekwencjonowania nowej generacji. Przedstawię też listę realnych problemów powstałych w efekcie tej pracy na podstawie przykładów z mojego …
9 grudnia 2025 11:00
Piotr Baranowski (MIMUW)
Meces: Latency-efficient Rescaling via Prioritized State Migration for Stateful Distributed Stream Processing Systems (Meces: Latency-efficient Rescaling via Prioritized State Migration for Stateful Distributed Stream Processing Systems)
Podczas seminarium przedstawię pracę „Meces: Latency-efficient Rescaling via Prioritized State Migration for Stateful Distributed Stream Processing Systems”, zaprezentowaną na konferencji USENIX ATC ’22. Najpierw przybliżę podstawy przetwarzania strumieniowego z utrzymywanym stanem, a następnie skupię się …
9 grudnia 2025 10:15
Michał Sobczak (MIMUW)
Corra: Correlation-Aware Column Compression (Corra: Correlation-Aware Column Compression)
Podczas referatu przedstawię podstawowe techniki wykorzystywane w kompresji lekkiej w systemach baz danych, uzupełnione krótką charakterystyką ich zalet i ograniczeń. Choć w praktyce dominuje kompresja kolumnowa, podejście to wiąże się z istotną wadą: prowadzi do …
2 grudnia 2025 10:15
Karol Wąsowski (MIMUW)
Photon: A Fast Query Engine for Lakehouse Systems (Photon: A Fast Query Engine for Lakehouse Systems)
Podczas referatu przedstawię kluczowe założenia i wyniki pracy "Photon: A Fast Query Engine for Lakehouse Systems" zaprezentowanej na konferencji SIGMOD 2022, w której autorzy propnują nowy silnik do efektywnej pracy z danymi przechowanymi w Datalake'ach. …
25 listopada 2025 11:00
Piotr Głowacki (MIMUW)
Boosting File Systems Elegantly: A Transparent NVM Write-ahead Log for Disk File Systems (Boosting File Systems Elegantly: A Transparent NVM Write-ahead Log for Disk File Systems)
Podczas referatu przedstawię kluczowe założenia i wyniki pracy „Boosting File Systems Elegantly: A Transparent NVM Write-ahead Log for Disk File Systems” (Wang et al., FAST 2025), w której zaproponowano system NVLog. Zacznę od wyjaśnienia czym …
25 listopada 2025 10:15
Dawid Pawlik (MIMUW)
Highways, Neighbors, Shortcuts, Walks - Introduction to ANN search and HNSW algorithm (Highways, Neighbors, Shortcuts, Walks - Introduction to ANN search and HNSW algorithm)
Podczas seminarium przedstawię algorytm HNSW, będący wynikiem pracy "Efficient and robust approximate nearest neighbor search using Hierarchical Navigable Small World graphs" (Yu. A. Malkov, D. A. Yashunin, IEEE Transactions on Pattern Analysis and Machine Intelligence), …