Nie jesteś zalogowany | Zaloguj się

Księgowość danych

Prelegent(ci)
Michał J Gajda
Afiliacja
Migamake Pte Ltd
Termin
5 października 2023 12:15
Pokój
p. 4060
Seminarium
Seminarium "DeSeR: Dane, strumienie, rozpraszanie"

Jak zapewnić poprawność analizy danych? Poza najlepszymi praktykami w statystyce (standardowe podsumowania eksperymentów) i bankowości (BCP 239), chciałoby się znaleźć matematyczny opis tego problemu.

Przedstawię metodologię rozwijaną w celu systematycznego podsumowywania danych. Metodologia nawiązuje do matematycznej aksjomatyki księgowości (grupy Paccioli oraz Ijiri 2018), korzysta z półgrup monotonicznych. Chociaż pierwsza implementacja tłumaczyła się na operatory SQL-a, to można udowodnić że metodologia pozwala na wyrażenie dowolnych obliczeń z wejścia na alfabecie pro-skończonym (profinite, czyli generowanym przez policzalną liczbę symboli). Metodologia wspiera wskazywanie ścieżki danych (provenance tracking), wpływu błędów na rezultat analizy (error impact reporting) i innych ocen ryzyka analitycznego (zgodnie z bankowym BCP 239).

Dodatkowo praca wpisuje się w nowoczesną filozofię księgowości która proponuje wyjście poza samą rachunkowość według wartości godziwej do rachunkowości opartej o bazę danych przedsiębiorstwa.

Praca jest w druku jako recenzowany rozdział książki o analityce danych wydawnictwa Taylor&Francis (preprint: https://arxiv.org/abs/2301.12583).

Jeżeli czas pozwoli, to przedstawię zajawki nowych twierdzeń o tej metodologii przygotowanych przy użyciu teorii półgrup.