Księgowość danych
- Prelegent(ci)
- Michał J Gajda
- Afiliacja
- Migamake Pte Ltd
- Termin
- 5 października 2023 12:15
- Pokój
- p. 4060
- Seminarium
- Seminarium "DeSeR: Dane, strumienie, rozpraszanie"
Jak zapewnić poprawność analizy danych? Poza najlepszymi praktykami w statystyce (standardowe podsumowania eksperymentów) i bankowości (BCP 239), chciałoby się znaleźć matematyczny opis tego problemu.
Przedstawię metodologię rozwijaną w celu systematycznego podsumowywania danych. Metodologia nawiązuje do matematycznej aksjomatyki księgowości (grupy Paccioli oraz Ijiri 2018), korzysta z półgrup monotonicznych. Chociaż pierwsza implementacja tłumaczyła się na operatory SQL-a, to można udowodnić że metodologia pozwala na wyrażenie dowolnych obliczeń z wejścia na alfabecie pro-skończonym (profinite, czyli generowanym przez policzalną liczbę symboli). Metodologia wspiera wskazywanie ścieżki danych (provenance tracking), wpływu błędów na rezultat analizy (error impact reporting) i innych ocen ryzyka analitycznego (zgodnie z bankowym BCP 239).
Dodatkowo praca wpisuje się w nowoczesną filozofię księgowości która proponuje wyjście poza samą rachunkowość według wartości godziwej do rachunkowości opartej o bazę danych przedsiębiorstwa.
Praca jest w druku jako recenzowany rozdział książki o analityce danych wydawnictwa Taylor&Francis (preprint: https://arxiv.org/
Jeżeli czas pozwoli, to przedstawię zajawki nowych twierdzeń o tej metodologii przygotowanych przy użyciu teorii półgrup.