You are not logged in | Log in

Księgowość danych

Speaker(s)
Michał J Gajda
Affiliation
Migamake Pte Ltd
Date
Oct. 5, 2023, 12:15 p.m.
Room
room 4060
Seminar
Seminarium "DeSeR: Dane, strumienie, rozpraszanie"

Jak zapewnić poprawność analizy danych? Poza najlepszymi praktykami w statystyce (standardowe podsumowania eksperymentów) i bankowości (BCP 239), chciałoby się znaleźć matematyczny opis tego problemu.

Przedstawię metodologię rozwijaną w celu systematycznego podsumowywania danych. Metodologia nawiązuje do matematycznej aksjomatyki księgowości (grupy Paccioli oraz Ijiri 2018), korzysta z półgrup monotonicznych. Chociaż pierwsza implementacja tłumaczyła się na operatory SQL-a, to można udowodnić że metodologia pozwala na wyrażenie dowolnych obliczeń z wejścia na alfabecie pro-skończonym (profinite, czyli generowanym przez policzalną liczbę symboli). Metodologia wspiera wskazywanie ścieżki danych (provenance tracking), wpływu błędów na rezultat analizy (error impact reporting) i innych ocen ryzyka analitycznego (zgodnie z bankowym BCP 239).

Dodatkowo praca wpisuje się w nowoczesną filozofię księgowości która proponuje wyjście poza samą rachunkowość według wartości godziwej do rachunkowości opartej o bazę danych przedsiębiorstwa.

Praca jest w druku jako recenzowany rozdział książki o analityce danych wydawnictwa Taylor&Francis (preprint: https://arxiv.org/abs/2301.12583).

Jeżeli czas pozwoli, to przedstawię zajawki nowych twierdzeń o tej metodologii przygotowanych przy użyciu teorii półgrup.